Отпечатай - Smartd предупреждения за seagate дискове

Титла: Smartd предупреждения за seagate дискове
Публикувано от: growchie в Apr 25, 2008, 11:43

На една машина с RAID5 масив от 4 диска Sеagate смарт статуса на 2 от тях даде следните грешки само след около 70 часа работа за sdd

Цитат

smartctl version 5.36 [x86_64-redhat-linux-gnu] Copyright © 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x000f 106 100 006 Pre-fail Always - 12242366
  3 Spin_Up_Time 0x0003 097 097 000 Pre-fail Always - 0
  4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 9
  5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
  7 Seek_Error_Rate 0x000f 100 253 030 Pre-fail Always - 8590712917
  9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 208
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 9
184 Unknown_Attribute 0x0032 100 100 099 Old_age Always - 0
187 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0
188 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0
189 Unknown_Attribute 0x003a 100 100 000 Old_age Always - 0
190 Unknown_Attribute 0x0022 071 065 045 Old_age Always - 538705949
194 Temperature_Celsius 0x0022 029 040 000 Old_age Always - 29 (Lifetime Min/Max 0/19)
195 Hardware_ECC_Recovered 0x001a 032 032 000 Old_age Always - 12242366
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 13
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 13
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0

и сътоветно sdc

Цитат

smartctl version 5.36 [x86_64-redhat-linux-gnu] Copyright © 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x000f 114 099 006 Pre-fail Always - 59295212
  3 Spin_Up_Time 0x0003 096 096 000 Pre-fail Always - 0
  4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 9
  5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
  7 Seek_Error_Rate 0x000f 061 060 030 Pre-fail Always - 1519218
  9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 208
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 9
184 Unknown_Attribute 0x0032 100 100 099 Old_age Always - 0
187 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0
188 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0
189 Unknown_Attribute 0x003a 100 100 000 Old_age Always - 0
190 Unknown_Attribute 0x0022 070 063 045 Old_age Always - 555548702
194 Temperature_Celsius 0x0022 030 040 000 Old_age Always - 30 (Lifetime Min/Max 0/18)
195 Hardware_ECC_Recovered 0x001a 039 024 000 Old_age Always - 59295212
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 1
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 1
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0

Притесняват ме Current_pending_Sector и Offline_Uncorrectable стойностите. Чета дота противоречиви твърдения относно това дали наистина дисковете имат лоши сектори или просто електрониката бърка. Дисковете са празни (до колкото може да бъде празен един RAID5 масив), и предполагам за това няма реалокирани сектори. sdd е хотспеър на групата, като преди това обаче беше активен. Направи тези 13 грешки и го фейлнах като после го прибавих като хотспеър, а хотспеъра sdc се активира автоматично. След като се активира sdc направи и той 1 грешка. Останалите 2 диска нямат такива проблеми.
Ако някой има опит с подобни проблеми бих бил щастлив ако може да ми каже дали трябва да се връщат дисковете и да се сменят с нови или е "козметичен проблем". Също бих желал да получа разяснение как точно се променят стойностите на двата параметъра, понеже забелязах, че се променят след рестарт и нормално са Old-age. smart таблицата постоянно ли се осъвременява или е нужен специален параметър към smartctl за тестване на стойностите?

Решението дисковете да са Seagate не е мое и е заварено положение, нямах никакъв шанс да повлияя върху вземането му. Казвам го понеже каквото питах до сега първата реакция беше "защо си купил Seagate"

Мерси предварително.

Титла: Smartd предупреждения за seagate дискове
Публикувано от: Naka в Apr 25, 2008, 14:22

Цитат (growchie @ Април 25 2008,12:43)

Също бих желал да получа разяснение как точно се променят стойностите на двата параметъра, понеже забелязах, че се променят след рестарт и нормално са Old-age. smart таблицата постоянно ли се осъвременява или е нужен специален параметър към smartctl за тестване на стойностите?

Решението дисковете да са Seagate не е мое и е заварено положение, нямах никакъв шанс да повлияя върху вземането му. Казвам го понеже каквото питах до сега първата реакция беше "защо си купил Seagate"

smart параметрите не могът да се променят отвънка, а се променят вътрешно - автоматично от firmware на диска. един параметър може да намалява ако нещо се е развалило и в последствие да почне пак да се увеличава ако поради някъква причина нещо се e оправило от самосебе си.

Имах такъв проблем: един диск не винаги развърташе при пускане на компютъра. Смарт параметъра (Spin_Retry_Count) се промени към лошо и след време биоса на компютера почна да съобщава 'лош диск'. махнах дъното на диска, зачистих му контактите на мотора, диска почна в последствие винаги да тръгва, смарт параметъра почна да се подобрява и след 4-5 рестарта biosa спря да се оплаква за лош диск.

smart параметрите на различните производители означават различни неща и се интерпретират по различен начин. Най-правилното е да се види какво точно означават тези параметри за Seagate

Seagate са много хубави дискове и са идеални за сървери. Почти не се развалят след много години работа. Ако нещо има то изниква още в самото начало.

Титла: Smartd предупреждения за seagate дискове
Публикувано от: Naka в Apr 25, 2008, 14:37

Това е моят сегате. работил е 3-4 години.
имам същите стойности за Current_pending_Sector и Offline_Uncorrectable -100 -100.

последната колонка RAW_VALUE са стойности които нищо не означават за потребителя, те се интерпретират и нормализират от firmaware и се изписват нормализирани в VALUE колонката. Някои RAW_VALUE непрекъснато се променят. Хич и не ги гледай.
RAW_VALUE- също зависи от производителя и може да е различен даже при различните модели. Никой няма да ти каже какво всъщност означава стойността на RAW_VALUE

Примерен код

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x000f 063 061 006 Pre-fail Always - 161241983
  3 Spin_Up_Time 0x0003 097 096 000 Pre-fail Always - 0
  4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 130
  5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
  7 Seek_Error_Rate 0x000f 084 060 030 Pre-fail Always - 308193627
  9 Power_On_Hours 0x0032 095 095 000 Old_age Always - 4605
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 099 099 020 Old_age Always - 1269
194 Temperature_Celsius 0x0022 033 051 000 Old_age Always - 33
195 Hardware_ECC_Recovered 0x001a 063 061 000 Old_age Always - 161241983
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline - 0
202 TA_Increase_Count 0x0032 100 253 000 Old_age Always - 0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
   1 0 0 Not_testing
   2 0 0 Not_testing
   3 0 0 Not_testing
   4 0 0 Not_testing
   5 0 0 Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Имаш стойности за двата параметъра 100(VALUE),
а границата на задействане (THRESH) ти е 0,
Това означава,че това 100 трябва да падне под нулата за да се развали диска!!! Имаш цели 100 бройки запас!

Титла: Smartd предупреждения за seagate дискове
Публикувано от: growchie в Apr 25, 2008, 14:55

Аз лично имам 5 сигейт диска но нито един от тях не дава стойности в тези 2 параметъра които да са различни от 0. Ще поизчакам да видя какво ще стане.
Мерси за разясненията по таблицата.

Linux за българи: Форуми

Linux секция за напреднали => Хардуерни и софтуерни проблеми => Темата е започната от: growchie в Apr 25, 2008, 11:43