Титла: Вечен проблем
Публикувано от: Addicted в Jul 24, 2012, 17:00
Здравейте! Този проблем го имам от както съм си купил машината. Дисковете превключват от АТА133 на АТА100, после АТА66, после АТА33, после PIO4, PIO3... и накрая се рестартира САТА контролера и тръгва. Някакви идеи как да реша проблема? Смених дисковете известно време работи и като се понапълниха малко и пак... Дебиан 2.6.24-etchnhalf.1-amd64 #1 SMP Wed Apr 29 08:06:31 UTC 2009 x86_64 GNU/Linux scsi0 : ata_piix scsi1 : ata_piix ata1: SATA max UDMA/133 cmd 0x1f0 ctl 0x3f6 bmdma 0x30a0 irq 14 ata2: SATA max UDMA/133 cmd 0x170 ctl 0x376 bmdma 0x30a8 irq 15 ata1.00: ATA-7: ST3250620AS, 3.AAK, max UDMA/133 ata1.00: 488397168 sectors, multi 16: LBA48 NCQ (depth 0/32) ata1.00: configured for UDMA/133 ata2.00: ATA-7: ST3250410AS, 4.AAA, max UDMA/133 ata2.00: 488397168 sectors, multi 16: LBA48 NCQ (depth 0/32) ata2.00: configured for UDMA/133 scsi 0:0:0:0: Direct-Access ATA ST3250620AS 3.AA PQ: 0 ANSI: 5 scsi 1:0:0:0: Direct-Access ATA ST3250410AS 4.AA PQ: 0 ANSI: 5 Driver 'sd' needs updating - please use bus_type methods sd 0:0:0:0: [sda] 488397168 512-byte hardware sectors (250059 MB) sd 0:0:0:0: [sda] Write Protect is off sd 0:0:0:0: [sda] Mode Sense: 00 3a 00 00 sd 0:0:0:0: [sda] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA sd 0:0:0:0: [sda] 488397168 512-byte hardware sectors (250059 MB) sd 0:0:0:0: [sda] Write Protect is off sd 0:0:0:0: [sda] Mode Sense: 00 3a 00 00 sd 0:0:0:0: [sda] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA sda: sda1 sda2 < sda5 > sd 0:0:0:0: [sda] Attached SCSI disk sd 1:0:0:0: [sdb] 488397168 512-byte hardware sectors (250059 MB) sd 1:0:0:0: [sdb] Write Protect is off sd 1:0:0:0: [sdb] Mode Sense: 00 3a 00 00 sd 1:0:0:0: [sdb] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA sd 1:0:0:0: [sdb] 488397168 512-byte hardware sectors (250059 MB) sd 1:0:0:0: [sdb] Write Protect is off sd 1:0:0:0: [sdb] Mode Sense: 00 3a 00 00 sd 1:0:0:0: [sdb] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA sdb: sdb1 sd 1:0:0:0: [sdb] Attached SCSI disk
Титла: Re: Вечен проблем
Публикувано от: petar258 в Jul 24, 2012, 17:25
Това може би се случва заради натрупване на грешки. А причините могат да са няколко - стара дистрибуция със със стари драйвери които не поддържат нещо, проблемно дъно, проблемни хард дискове(но щом си ги сменял вероятно това отпада). Пробвай с актуална версия на дебиан, че смяна на дъното е доста голяма крачка. ;D
А и кабелите от дъното до дисковете(ако са с IDE интерфейс) могат да са причина, те не търпят мачкане и ако са намачкани могат да вкарват грешки.
Титла: Re: Вечен проблем
Публикувано от: runtime в Jul 24, 2012, 18:11
Това може би се случва заради натрупване на грешки. А причините могат да са няколко - стара дистрибуция със със стари драйвери които не поддържат нещо, проблемно дъно, проблемни хард дискове(но щом си ги сменял вероятно това отпада). Пробвай с актуална версия на дебиан, че смяна на дъното е доста голяма крачка. ;D
А и кабелите от дъното до дисковете(ако са с IDE интерфейс) могат да са причина, те не търпят мачкане и ако са намачкани могат да вкарват грешки.
Ооо и SATA кабели има доста, който трупа грешки с тях... Но това лесно може да се види от S.M.A.R.T. да пусни един и да даде резултата. Има голяма вероятност да е от кабели, но така или иначе ако е хардуерно в SMART-a ще го отрази.
Титла: Re: Вечен проблем
Публикувано от: Addicted в Jul 25, 2012, 03:55
smartctl version 5.38 [x86_64-unknown-linux-gnu] Copyright (C) 2002-8 Bruce Allen Home page is http://smartmontools.sourceforge.net/
=== START OF INFORMATION SECTION === Model Family: Seagate Barracuda 7200.10 family Device Model: ST3250620AS Serial Number: 6QE1HMHB Firmware Version: 3.AAK User Capacity: 250,059,350,016 bytes Device is: In smartctl database [for details use: -P show] ATA Version is: 7 ATA Standard is: Exact ATA specification draft version not indicated Local Time is: Wed Jul 25 03:52:40 2012 EEST SMART support is: Available - device has SMART capability. SMART support is: Enabled
=== START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED
General SMART Values: Offline data collection status: (0x82) Offline data collection activity was completed without error. Auto Offline Data Collection: Enabled. Self-test execution status: ( 0) The previous self-test routine completed without error or no self-test has ever been run. Total time to complete Offline data collection: ( 430) seconds. Offline data collection capabilities: (0x5b) SMART execute Offline immediate. Auto Offline data collection on/off support. Suspend Offline collection upon new command. Offline surface scan supported. Self-test supported. No Conveyance Self-test supported. Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data before entering power-saving mode. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Short self-test routine recommended polling time: ( 1) minutes. Extended self-test routine recommended polling time: ( 92) minutes.
SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 120 072 006 Pre-fail Always - 0 3 Spin_Up_Time 0x0003 096 096 000 Pre-fail Always - 0 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 49 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0 7 Seek_Error_Rate 0x000f 089 060 030 Pre-fail Always - 861845713 9 Power_On_Hours 0x0032 050 050 000 Old_age Always - 43845 10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0 12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 49 187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0 189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0 190 Airflow_Temperature_Cel 0x0022 068 053 045 Old_age Always - 32 (Lifetime Min/Max 27/47) 194 Temperature_Celsius 0x0022 032 047 000 Old_age Always - 32 (0 15 0 0) 195 Hardware_ECC_Recovered 0x001a 062 052 000 Old_age Always - 56597540 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0 200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline - 0 202 TA_Increase_Count 0x0032 100 253 000 Old_age Always - 0
SMART Error Log Version: 1 No Errors Logged
SMART Self-test log structure revision number 1
SMART Selective self-test log data structure revision number 1 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Not_testing 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 Not_testing Selective self-test flags (0x0): After scanning selected spans, do NOT read-scan remainder of disk. If Selective self-test is pending on power-up, resume after 0 minute delay.
Това беше за СДА smartctl version 5.38 [x86_64-unknown-linux-gnu] Copyright (C) 2002-8 Bruce Allen Home page is http://smartmontools.sourceforge.net/
=== START OF INFORMATION SECTION === Model Family: Seagate Barracuda 7200.10 family Device Model: ST3250410AS Serial Number: 6RYFVWMB Firmware Version: 4.AAA User Capacity: 250,059,350,016 bytes Device is: In smartctl database [for details use: -P show] ATA Version is: 7 ATA Standard is: Exact ATA specification draft version not indicated Local Time is: Wed Jul 25 03:53:31 2012 EEST SMART support is: Available - device has SMART capability. SMART support is: Enabled
=== START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED
General SMART Values: Offline data collection status: (0x82) Offline data collection activity was completed without error. Auto Offline Data Collection: Enabled. Self-test execution status: ( 0) The previous self-test routine completed without error or no self-test has ever been run. Total time to complete Offline data collection: ( 430) seconds. Offline data collection capabilities: (0x5b) SMART execute Offline immediate. Auto Offline data collection on/off support. Suspend Offline collection upon new command. Offline surface scan supported. Self-test supported. No Conveyance Self-test supported. Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data before entering power-saving mode. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Short self-test routine recommended polling time: ( 1) minutes. Extended self-test routine recommended polling time: ( 64) minutes. SCT capabilities: (0x0001) SCT Status supported.
SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 100 253 006 Pre-fail Always - 0 3 Spin_Up_Time 0x0003 098 098 000 Pre-fail Always - 0 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 6 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0 7 Seek_Error_Rate 0x000f 088 060 030 Pre-fail Always - 708847021 9 Power_On_Hours 0x0032 064 064 000 Old_age Always - 31617 10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0 12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 6 187 Reported_Uncorrect 0x0032 001 001 000 Old_age Always - 3852 189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0 190 Airflow_Temperature_Cel 0x0022 070 056 045 Old_age Always - 30 (Lifetime Min/Max 23/44) 194 Temperature_Celsius 0x0022 030 044 000 Old_age Always - 30 (0 23 0 0) 195 Hardware_ECC_Recovered 0x001a 052 050 000 Old_age Always - 6145118 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 1 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 1 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0 200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline - 0 202 TA_Increase_Count 0x0032 100 253 000 Old_age Always - 0
SMART Error Log Version: 1 ATA Error Count: 3852 (device log contains only the most recent five errors) CR = Command Register [HEX] FR = Features Register [HEX] SC = Sector Count Register [HEX] SN = Sector Number Register [HEX] CL = Cylinder Low Register [HEX] CH = Cylinder High Register [HEX] DH = Device/Head Register [HEX] DC = Device Command Register [HEX] ER = Error register [HEX] ST = Status register [HEX] Powered_Up_Time is measured from power on, and printed as DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes, SS=sec, and sss=millisec. It "wraps" after 49.710 days.
Error 3852 occurred at disk power-on lifetime: 31594 hours (1316 days + 10 hours) When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were: ER ST SC SN CL CH DH -- -- -- -- -- -- -- 40 51 00 00 ed 38 e7 Error: UNC at LBA = 0x0738ed00 = 121171200
Commands leading to the command that caused the error were: CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name -- -- -- -- -- -- -- -- ---------------- -------------------- c8 00 08 ff ec 38 e7 00 06:20:26.078 READ DMA 27 00 00 00 00 00 e0 00 06:20:26.070 READ NATIVE MAX ADDRESS EXT ec 00 00 00 00 00 a0 00 06:20:22.212 IDENTIFY DEVICE ef 03 46 00 00 00 a0 00 06:20:22.211 SET FEATURES [Set transfer mode] 27 00 00 00 00 00 e0 00 06:20:22.195 READ NATIVE MAX ADDRESS EXT
Error 3851 occurred at disk power-on lifetime: 31594 hours (1316 days + 10 hours) When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were: ER ST SC SN CL CH DH -- -- -- -- -- -- -- 40 51 00 00 ed 38 e7 Error: UNC at LBA = 0x0738ed00 = 121171200
Commands leading to the command that caused the error were: CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name -- -- -- -- -- -- -- -- ---------------- -------------------- c8 00 08 ff ec 38 e7 00 06:20:14.258 READ DMA 27 00 00 00 00 00 e0 00 06:20:14.250 READ NATIVE MAX ADDRESS EXT ec 00 00 00 00 00 a0 00 06:20:22.212 IDENTIFY DEVICE ef 03 46 00 00 00 a0 00 06:20:22.211 SET FEATURES [Set transfer mode] 27 00 00 00 00 00 e0 00 06:20:22.195 READ NATIVE MAX ADDRESS EXT
Error 3850 occurred at disk power-on lifetime: 31594 hours (1316 days + 10 hours) When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were: ER ST SC SN CL CH DH -- -- -- -- -- -- -- 40 51 00 00 ed 38 e7 Error: UNC at LBA = 0x0738ed00 = 121171200
Commands leading to the command that caused the error were: CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name -- -- -- -- -- -- -- -- ---------------- -------------------- c8 00 08 ff ec 38 e7 00 06:20:14.258 READ DMA 27 00 00 00 00 00 e0 00 06:20:14.250 READ NATIVE MAX ADDRESS EXT ec 00 00 00 00 00 a0 00 06:20:14.243 IDENTIFY DEVICE ef 03 46 00 00 00 a0 00 06:20:14.242 SET FEATURES [Set transfer mode] 27 00 00 00 00 00 e0 00 06:20:14.240 READ NATIVE MAX ADDRESS EXT
Error 3849 occurred at disk power-on lifetime: 31594 hours (1316 days + 10 hours) When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were: ER ST SC SN CL CH DH -- -- -- -- -- -- -- 40 51 00 00 ed 38 e7 Error: UNC at LBA = 0x0738ed00 = 121171200
Commands leading to the command that caused the error were: CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name -- -- -- -- -- -- -- -- ---------------- -------------------- c8 00 08 ff ec 38 e7 00 06:20:14.258 READ DMA 27 00 00 00 00 00 e0 00 06:20:14.250 READ NATIVE MAX ADDRESS EXT ec 00 00 00 00 00 a0 00 06:20:14.243 IDENTIFY DEVICE ef 03 46 00 00 00 a0 00 06:20:14.242 SET FEATURES [Set transfer mode] 27 00 00 00 00 00 e0 00 06:20:14.240 READ NATIVE MAX ADDRESS EXT
Error 3848 occurred at disk power-on lifetime: 31594 hours (1316 days + 10 hours) When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were: ER ST SC SN CL CH DH -- -- -- -- -- -- -- 40 51 00 00 ed 38 e7 Error: UNC at LBA = 0x0738ed00 = 121171200
Commands leading to the command that caused the error were: CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name -- -- -- -- -- -- -- -- ---------------- -------------------- c8 00 08 ff ec 38 e7 00 06:20:06.454 READ DMA 27 00 00 00 00 00 e0 00 06:20:06.447 READ NATIVE MAX ADDRESS EXT ec 00 00 00 00 00 a0 00 06:20:02.588 IDENTIFY DEVICE ef 03 46 00 00 00 a0 00 06:20:02.587 SET FEATURES [Set transfer mode] 27 00 00 00 00 00 e0 00 06:20:02.574 READ NATIVE MAX ADDRESS EXT
SMART Self-test log structure revision number 1
SMART Selective self-test log data structure revision number 1 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Not_testing 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 Not_testing Selective self-test flags (0x0): After scanning selected spans, do NOT read-scan remainder of disk. If Selective self-test is pending on power-up, resume after 0 minute delay.
Това беше СДБ! Това е СМАРТ инфото на 2-та диска. Дисковете са САТА, сменяни са кабели, не са намачкани това е интелско пс всичко му е интел сървър версия дори и кутията е интел и за смяна на дъно не може да става и на въпрос, имам го от 2007-та някъде и още тогава си го имаше този проблем. Бях със Слак и не можах да му реша проблема дори и РАЙД-а не мога да подкарам в смисъл раида си тръгва, но линукса не го вижда - вижда дисковете като 2, а със софтуерен райд беше пълна боза. За това си ги оставих 2-та диска отделни и на единия се правят бекъпи и така става :) Дебиана е ъп-то дейт. Ако имате идеи и мнения пишете.
Титла: Re: Вечен проблем
Публикувано от: nemanema в Jul 25, 2012, 05:31
Здрасти, Незнам как да го обесня лесно, но ще карам направо, дано ме разбереш. Ако инфото, което е дадено за дисковете, е това: Model Family: Seagate Barracuda 7200.10 family Device Model: ST3250620AS С тия милиони грешки, защо до сега не е търсено решение. И ако наистина от 2008~2009 година насам го имаш проблема, само за статистиката да питам, в нета няма ли информация колко са бъг-ави тези серии на модела ? Правил ли си флаш на фърмуера на дисковете ? Пусни едно търсене за проблем с модификация Seagate Barracuda 7200.10. От сайта на производителя се сваля флаш-а и си префлаш-ни фърмуера. Естествено се прочита съпътстващата документация и как се прави на дисковете, един по-един. Принципно не трябва да ти се прецака информацията, но . . . страх лозе пази ! И в духа на флаш-а, да питам и за дъното. Нови версии на фърмуер, обновявания ? Успех !
П.П. На феновете на марката, не раздувайте пристрастия, моля ! Да, има и отлични модели на марката, но явно питащия не притежава такъв.
Титла: Re: Вечен проблем
Публикувано от: nyakoy в Jul 25, 2012, 09:21
Аз бях чел, че 500ГБ на морския портал са доста проблемни и се оправя положението с обновяване на фърма и веднага обнових.
Титла: Re: Вечен проблем
Публикувано от: tolostoi в Jul 25, 2012, 12:11
Етчнхалф, не може да бъде ъп ту дейт ;D Проблема би се решил с по-ново ядро. Ако горните съвети за ъпдейт на фърмуер на дисковете не помогнат (бтв ти така или иначе трябва да ъпдейтнеш, щом производителя на дисковете препоръчва). Явно ти е критична машината и не ти се прави ъпгрейд, поогледай се за някое по-ново ядро от дебиан бекпортс за етч, ако намериш :( ако не компилирай сам.
Титла: Re: Вечен проблем
Публикувано от: runtime в Jul 25, 2012, 12:39
Кабел няма да е, там плющи на UDMA_CRC_Error_Count. Защо не пробваш ( ако не си до сега ) да обновиш БИОС-а ( ако има и по-нова версия де, но обикновено ако не си префлашвал ще е стара ) та бърем се оправи :) Аз бих почнал от там и тъй като вероятността е по-голяма да е от там от колкото в ядрото. Другото е както казаха колегите да минеш и през фирмуеъра на диска и т.н. т.н. да минеш през всички та да стигнеш до бъг в ядрото :)
Титла: Re: Вечен проблем
Публикувано от: plandz в Jul 25, 2012, 21:07
Внимавайте с ъпдейтите на фърмуера на проблемните дискове на Seagate!!! Внимателно прочетете информацията от сайта за кои точно дискове се налага ъпдейт! Налага се само за определени серии,произведени с определен фърмуер.Аз също имам диск от тези серии и се бях засилил на времето да го ъпдейтвам,защото се бях подплашил,но като прочетох внимателно се оказа,че е произведен извън времето на производство на тези с некачествен фърмуер и че фърмуерът му е добър. Ако се флашне ъпдейтващият фърмеур на непроблемни дискове,то те заминават в безкрая...без време. Моят вече 4 години си работи добре и без проблеми (да не чува дявола!).500 ГБ е и е ST3500320AS.Точно от проблемната серия,но произведен в добро време и с работещ фърмуер.
Ето тук е написано всичко и има всичко: http://knowledge.seagate.com/articles/en_US/FAQ/207951en http://knowledge.seagate.com/articles/en_US/FAQ/207957en
Ето и програмката за детектване на диска: http://support.seagate.com/kbimg/utils/drivedetect.exe
Успех!
Титла: Re: Вечен проблем
Публикувано от: Me4oKyX в Jul 26, 2012, 00:05
А някой може ли да каже как се прави тази SMART проверка, с команда в конзолата ли е или е БИОС-ка настройка нещо !? Че да проверя и моите, да съм си 100% сигурен ;D
Титла: Re: Вечен проблем
Публикувано от: Addicted в Jul 26, 2012, 07:18
Работите отиват към да си го взема в нас сървъра за малко тестове... И ново линукс (Слакче-Влакче) :)
Мерси на всички за предложенията ще опитам избрани тестове ;)
Ако имате още идеи пишете проверявам редовно темата.
Ако намеря решение ще информирам всички в темата :)
Титла: Re: Вечен проблем
Публикувано от: Gogo_SZ в Jul 27, 2012, 22:55
Аз бих проверил на първо място захранването и после дъното. Дисковете ВЕЧЕ СИ ГИ ПРОВЕРИЛ!!!! Не скапвай следващи. Тоя номер съм го виждал бая пъти и ВИНАГИ се е оказвало едно от двете. Не че и дисковете не се скапват, ама при 24/7 режим на работа един калпав диск остисква 3-4 пъти по-дълго от повечето захранвания и с абсолютна сигурност МНОООООГО повече от което и да е дъно с AMD.
Титла: Re: Вечен проблем
Публикувано от: Gogo_SZ в Jul 27, 2012, 22:59
P.S.
Проблемите с захр.блок и дъното обикновенно са видими с просто око: Оглеждаш внимателно всички електролитни кондензатори - ако видиш дори минимално поддуване отгоре или "напикаване" отдилу = сменяй платката!!!
|