Титла: Smartd предупреждения за seagate дискове
Публикувано от: growchie в Apr 25, 2008, 11:43
На една машина с RAID5 масив от 4 диска Sеagate смарт статуса на 2 от тях даде следните грешки само след около 70 часа работа за sdd Цитат | smartctl version 5.36 [x86_64-redhat-linux-gnu] Copyright © 2002-6 Bruce Allen Home page is http://smartmontools.sourceforge.net/
=== START OF READ SMART DATA SECTION === SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 106 100 006 Pre-fail Always - 12242366 3 Spin_Up_Time 0x0003 097 097 000 Pre-fail Always - 0 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 9 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0 7 Seek_Error_Rate 0x000f 100 253 030 Pre-fail Always - 8590712917 9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 208 10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0 12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 9 184 Unknown_Attribute 0x0032 100 100 099 Old_age Always - 0 187 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0 188 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0 189 Unknown_Attribute 0x003a 100 100 000 Old_age Always - 0 190 Unknown_Attribute 0x0022 071 065 045 Old_age Always - 538705949 194 Temperature_Celsius 0x0022 029 040 000 Old_age Always - 29 (Lifetime Min/Max 0/19) 195 Hardware_ECC_Recovered 0x001a 032 032 000 Old_age Always - 12242366 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 13 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 13 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
|
и сътоветно sdc
Цитат | smartctl version 5.36 [x86_64-redhat-linux-gnu] Copyright © 2002-6 Bruce Allen Home page is http://smartmontools.sourceforge.net/
=== START OF READ SMART DATA SECTION === SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 114 099 006 Pre-fail Always - 59295212 3 Spin_Up_Time 0x0003 096 096 000 Pre-fail Always - 0 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 9 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0 7 Seek_Error_Rate 0x000f 061 060 030 Pre-fail Always - 1519218 9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 208 10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0 12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 9 184 Unknown_Attribute 0x0032 100 100 099 Old_age Always - 0 187 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0 188 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0 189 Unknown_Attribute 0x003a 100 100 000 Old_age Always - 0 190 Unknown_Attribute 0x0022 070 063 045 Old_age Always - 555548702 194 Temperature_Celsius 0x0022 030 040 000 Old_age Always - 30 (Lifetime Min/Max 0/18) 195 Hardware_ECC_Recovered 0x001a 039 024 000 Old_age Always - 59295212 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 1 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 1 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
|
Притесняват ме Current_pending_Sector и Offline_Uncorrectable стойностите. Чета дота противоречиви твърдения относно това дали наистина дисковете имат лоши сектори или просто електрониката бърка. Дисковете са празни (до колкото може да бъде празен един RAID5 масив), и предполагам за това няма реалокирани сектори. sdd е хотспеър на групата, като преди това обаче беше активен. Направи тези 13 грешки и го фейлнах като после го прибавих като хотспеър, а хотспеъра sdc се активира автоматично. След като се активира sdc направи и той 1 грешка. Останалите 2 диска нямат такива проблеми. Ако някой има опит с подобни проблеми бих бил щастлив ако може да ми каже дали трябва да се връщат дисковете и да се сменят с нови или е "козметичен проблем". Също бих желал да получа разяснение как точно се променят стойностите на двата параметъра, понеже забелязах, че се променят след рестарт и нормално са Old-age. smart таблицата постоянно ли се осъвременява или е нужен специален параметър към smartctl за тестване на стойностите?
Решението дисковете да са Seagate не е мое и е заварено положение, нямах никакъв шанс да повлияя върху вземането му. Казвам го понеже каквото питах до сега първата реакция беше "защо си купил Seagate"
Мерси предварително.
Титла: Smartd предупреждения за seagate дискове
Публикувано от: Naka в Apr 25, 2008, 14:22
Цитат (growchie @ Април 25 2008,12:43) | Също бих желал да получа разяснение как точно се променят стойностите на двата параметъра, понеже забелязах, че се променят след рестарт и нормално са Old-age. smart таблицата постоянно ли се осъвременява или е нужен специален параметър към smartctl за тестване на стойностите?
Решението дисковете да са Seagate не е мое и е заварено положение, нямах никакъв шанс да повлияя върху вземането му. Казвам го понеже каквото питах до сега първата реакция беше "защо си купил Seagate" |
smart параметрите не могът да се променят отвънка, а се променят вътрешно - автоматично от firmware на диска. един параметър може да намалява ако нещо се е развалило и в последствие да почне пак да се увеличава ако поради някъква причина нещо се e оправило от самосебе си.
Имах такъв проблем: един диск не винаги развърташе при пускане на компютъра. Смарт параметъра (Spin_Retry_Count) се промени към лошо и след време биоса на компютера почна да съобщава 'лош диск'. махнах дъното на диска, зачистих му контактите на мотора, диска почна в последствие винаги да тръгва, смарт параметъра почна да се подобрява и след 4-5 рестарта biosa спря да се оплаква за лош диск.
smart параметрите на различните производители означават различни неща и се интерпретират по различен начин. Най-правилното е да се види какво точно означават тези параметри за Seagate
Seagate са много хубави дискове и са идеални за сървери. Почти не се развалят след много години работа. Ако нещо има то изниква още в самото начало.
Титла: Smartd предупреждения за seagate дискове
Публикувано от: Naka в Apr 25, 2008, 14:37
Това е моят сегате. работил е 3-4 години. имам същите стойности за Current_pending_Sector и Offline_Uncorrectable -100 -100. последната колонка RAW_VALUE са стойности които нищо не означават за потребителя, те се интерпретират и нормализират от firmaware и се изписват нормализирани в VALUE колонката. Някои RAW_VALUE непрекъснато се променят. Хич и не ги гледай. RAW_VALUE- също зависи от производителя и може да е различен даже при различните модели. Никой няма да ти каже какво всъщност означава стойността на RAW_VALUE Примерен код | SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 063 061 006 Pre-fail Always - 161241983 3 Spin_Up_Time 0x0003 097 096 000 Pre-fail Always - 0 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 130 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0 7 Seek_Error_Rate 0x000f 084 060 030 Pre-fail Always - 308193627 9 Power_On_Hours 0x0032 095 095 000 Old_age Always - 4605 10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0 12 Power_Cycle_Count 0x0032 099 099 020 Old_age Always - 1269 194 Temperature_Celsius 0x0022 033 051 000 Old_age Always - 33 195 Hardware_ECC_Recovered 0x001a 063 061 000 Old_age Always - 161241983 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0 200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline - 0 202 TA_Increase_Count 0x0032 100 253 000 Old_age Always - 0
SMART Error Log Version: 1 No Errors Logged
SMART Self-test log structure revision number 1 No self-tests have been logged. [To run self-tests, use: smartctl -t]
SMART Selective self-test log data structure revision number 1 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Not_testing 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 Not_testing Selective self-test flags (0x0): After scanning selected spans, do NOT read-scan remainder of disk. If Selective self-test is pending on power-up, resume after 0 minute delay. |
Имаш стойности за двата параметъра 100(VALUE), а границата на задействане (THRESH) ти е 0, Това означава,че това 100 трябва да падне под нулата за да се развали диска!!! Имаш цели 100 бройки запас!
Титла: Smartd предупреждения за seagate дискове
Публикувано от: growchie в Apr 25, 2008, 14:55
Аз лично имам 5 сигейт диска но нито един от тях не дава стойности в тези 2 параметъра които да са различни от 0. Ще поизчакам да видя какво ще стане. Мерси за разясненията по таблицата.
|