пц подкрался незаметно

Postby fk0 » 20 Nov 2011, 13:06

Рано с утра от буханки пришла пачка писем такого содержания:

Device: /dev/sdb [SAT], FAILED SMART self-check. BACK UP DATA NOW!
Device: /dev/sdb [SAT], Failed SMART usage Attribute: 5 Reallocated_Sector_Ct

Весь syslog варнингами забит. Ошибок чтения записи не было.

# smartctl -a /dev/sdb
=== START OF INFORMATION SECTION ===
Model Family: Seagate Barracuda LP
Device Model: ST3500412AS
Serial Number: 6VV22RPV
Firmware Version: CC32
User Capacity: 500,107,862,016 bytes
Device is: In smartctl database [for details use: -P show]
ATA Version is: 8
ATA Standard is: ATA-8-ACS revision 4
Local Time is: Sun Nov 20 14:32:55 2011 MSK
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: FAILED!
Drive failure expected in less than 24 hours. SAVE ALL DATA.
Code: Select all
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   114   099   006    Pre-fail  Always       -       71909075
  3 Spin_Up_Time            0x0003   098   097   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       80
  5 Reallocated_Sector_Ct   0x0033   036   036   036    Pre-fail  Always   FAILING_NOW 2633
  7 Seek_Error_Rate         0x000f   078   060   030    Pre-fail  Always       -       66175628
  9 Power_On_Hours          0x0032   088   088   000    Old_age   Always       -       10791
10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       39
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   069   059   045    Old_age   Always       -       31 (Lifetime Min/Max 27/36)
194 Temperature_Celsius     0x0022   031   041   000    Old_age   Always       -       31 (0 17 0 0)
195 Hardware_ECC_Recovered  0x001a   033   019   000    Old_age   Always       -       71909075
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       109848083573285
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       2487720008
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       3318445570

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed: unknown failure    90%     10791         0
# 2  Short offline       Completed without error       00%      9365         -
# 3  Extended offline    Completed without error       00%      4340         -
# 4  Short offline       Completed without error       00%      4338         -


Что бы это значило?

PS: western digital green, который башкой более миллиона раз нащёлкал (за пределами всех расчётных значений) из-за ошибки в ПО (засыпал постоянно) выглядит как новый...
* Origin: зип файл! (2:5030/1559)
User avatar
fk0
 
Posts: 1533
Joined: 07 Apr 2007, 01:08
Group: Registered users

Postby breeze » 20 Nov 2011, 15:19

Это означает только одно — «BACK UP DATA NOW!»

p.s. western digital — это контора харды которой я никогда не куплю!
breeze
 
Posts: 538
Joined: 07 Feb 2009, 16:19
Group: Registered users

Postby fk0 » 20 Nov 2011, 15:43

Дык сдох-то не вестерн, а сигейт барракуда. BTW за всю мою жизнь вестерны характеризивали себя как одни из наиболее надёжных.

Device: /dev/sdb [SAT], Self-Test Log error count increased from 0 to 2 -- продолжается. Причём работает. :-/

IMHO у него тест смарта глючит в тех местах, где простое чтение не глючит. Что бы это значило?
Во всём виноваты программисты (как всегда)... Или шальной фотон залетел из соседней галактики, попал прямо в контроллер и что-то там сбойнуло до следующей перезагрузки.
* Origin: зип файл! (2:5030/1559)
User avatar
fk0
 
Posts: 1533
Joined: 07 Apr 2007, 01:08
Group: Registered users

Postby lvd » 20 Nov 2011, 15:49

fk0 wrote:PS: western digital green, который башкой более миллиона раз нащёлкал (за пределами всех расчётных значений) из-за ошибки в ПО (засыпал постоянно) выглядит как новый...

Ламир! Утилитко есть wdidle3 в которой этот ваш бошкошёлкинг отключаецо нах! Утилитко, правда, изпод доса запускаецо (фридос канает) и надо флешку загрузочную делать. Я так все вдшки обхуячил себе и не только. Правда некоторые уже 700 тыщ нашёлкали и дохнуть не собираются.
F̞͖̭̿̔ͯu̐̅cͬ̑ͩk̨̤̳͇̮̭̪̠̽̿̓̆ͭͩ ̷̩̰͎̩͓̘̾̀ͬ̊ͭ͛ͅda̝̺͙̬͎̝̾͟ ̰̜̝̯͉̯̖̓̎́ͨ̽ͫ͟f̟͇̭̀ͬͨͭ̐̚u̹̼̹̗̞͑̔͂͐̚cͭ̅̊̆̒̆ǩ̝̩̯́ͥ̔̍̑ḭ͓͍̳̬ͦ̽͂n͍͎͈̈̅ͩͬ ̊ͫ̂̾̑̈́f̲͚͉͓͗̋́ͧͦ̅ȗ͇̲̻͈̲̅̎͗͒ͭ͡c̬̟̠̹̯̈́ͩ͘ͅk̫̠̻̋͜a̲͒̾̇!͙͕̺͉̗̩̲̂̏̄̀
User avatar
lvd
 
Posts: 7227
Joined: 07 Apr 2007, 21:28
Group: Registered users

Postby lvd » 20 Nov 2011, 15:51

fk0 wrote: 9 Power_On_Hours 0x0032 088 088 000 Old_age Always - 10791

fk0 wrote: 5 Reallocated_Sector_Ct 0x0033 036 036 036 Pre-fail Always FAILING_NOW 2633

Да, помер молодым...
F̞͖̭̿̔ͯu̐̅cͬ̑ͩk̨̤̳͇̮̭̪̠̽̿̓̆ͭͩ ̷̩̰͎̩͓̘̾̀ͬ̊ͭ͛ͅda̝̺͙̬͎̝̾͟ ̰̜̝̯͉̯̖̓̎́ͨ̽ͫ͟f̟͇̭̀ͬͨͭ̐̚u̹̼̹̗̞͑̔͂͐̚cͭ̅̊̆̒̆ǩ̝̩̯́ͥ̔̍̑ḭ͓͍̳̬ͦ̽͂n͍͎͈̈̅ͩͬ ̊ͫ̂̾̑̈́f̲͚͉͓͗̋́ͧͦ̅ȗ͇̲̻͈̲̅̎͗͒ͭ͡c̬̟̠̹̯̈́ͩ͘ͅk̫̠̻̋͜a̲͒̾̇!͙͕̺͉̗̩̲̂̏̄̀
User avatar
lvd
 
Posts: 7227
Joined: 07 Apr 2007, 21:28
Group: Registered users

Postby TS-Labs » 20 Nov 2011, 16:12

fk0 wrote:Model Family: Seagate Barracuda LP

В топку переплавку!!!
TS-Labs
 
Posts: 1150
Joined: 19 Apr 2010, 10:10
Location: Wildest West
Group: Registered users

Postby deathsoft » 20 Nov 2011, 18:39

195 Hardware_ECC_Recovered 0x001a 033 019 000 Old_age Always - 71909075
User avatar
deathsoft
 
Posts: 4669
Joined: 07 Apr 2007, 00:58
Group: Registered users

Postby fk0 » 20 Nov 2011, 18:58

И чё это значит? Читается всё ок, пишется и т.п.
* Origin: зип файл! (2:5030/1559)
User avatar
fk0
 
Posts: 1533
Joined: 07 Apr 2007, 01:08
Group: Registered users

Postby lvd » 20 Nov 2011, 21:25

дохлые секторы реаллоцируются. Как станет некуда реаллоцировать -- начнёт нечитаться, очевидно же.
F̞͖̭̿̔ͯu̐̅cͬ̑ͩk̨̤̳͇̮̭̪̠̽̿̓̆ͭͩ ̷̩̰͎̩͓̘̾̀ͬ̊ͭ͛ͅda̝̺͙̬͎̝̾͟ ̰̜̝̯͉̯̖̓̎́ͨ̽ͫ͟f̟͇̭̀ͬͨͭ̐̚u̹̼̹̗̞͑̔͂͐̚cͭ̅̊̆̒̆ǩ̝̩̯́ͥ̔̍̑ḭ͓͍̳̬ͦ̽͂n͍͎͈̈̅ͩͬ ̊ͫ̂̾̑̈́f̲͚͉͓͗̋́ͧͦ̅ȗ͇̲̻͈̲̅̎͗͒ͭ͡c̬̟̠̹̯̈́ͩ͘ͅk̫̠̻̋͜a̲͒̾̇!͙͕̺͉̗̩̲̂̏̄̀
User avatar
lvd
 
Posts: 7227
Joined: 07 Apr 2007, 21:28
Group: Registered users

Postby deathsoft » 20 Nov 2011, 23:24

fk0 wrote:И чё это значит?

У тебя еще куча ECC ерорсов, это сектора контроллером пишутся и читаются с ошибками, видимо херовый контакт между платой и гермоблоком (как на ibm dtla)
User avatar
deathsoft
 
Posts: 4669
Joined: 07 Apr 2007, 00:58
Group: Registered users

Next

Return to Hardware

Who is online

Users browsing this forum: No registered users and 4 guests

cron