Linux за българи: Форуми

Хумор, сатира и забава => Кошче => Темата е започната от: go_fire в Апр 12, 2019, 00:39



Титла: Диагностика на твърд диск?
Публикувано от: go_fire в Апр 12, 2019, 00:39
Това никога не съм го знаел, как става.

От някакво време (дни), започнаха да ми се случват странни неща. Машината умира. В смисъл картинка има, даже мишката се движи, но нищо друго не се случва. В нормална конзола започват да се плюят някакви надписи blk нещо си. Не се приемат никакви команди чак до init 0. Тези „blk нещо си“ очевидно идват от ядрото и би трябвало да ми казват, че не успява да пише във ФС.  Другите надписи, които излизат, ми казват, че и да прочете не може.

Сетих се да гледам S.M.A.R.T., но поне аз не видях нещо, което да ми изглежда подозрително.

Ето го пълния:

Код:
root@debian:/home/user# smartctl --all /dev/sda                 
smartctl 6.4 2014-10-07 r4002 [x86_64-linux-3.16.0-4-amd64] (local build)
Copyright (C) 2002-14, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Device Model:     ST1000LM048-2E7172
Serial Number:    WDEXLX4V
LU WWN Device Id: 5 000c50 0acf23241
Firmware Version: SDM1
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Form Factor:      2.5 inches
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ACS-3 T13/2161-D revision 3b
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Fri Apr 12 00:11:28 2019 EEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
See vendor-specific Attribute list for marginal Attributes.

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                                        was never started.
                                        Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                (    0) seconds.
Offline data collection
capabilities:                    (0x71) SMART execute Offline immediate.
                                        No Auto Offline data collection support.
                                        Suspend Offline collection upon new
                                        command.
                                        No Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine
recommended polling time:        (   1) minutes.
Extended self-test routine
recommended polling time:        ( 166) minutes.
Conveyance self-test routine
recommended polling time:        (   2) minutes.
SCT capabilities:              (0x3035) SCT Status supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   062   061   006    Pre-fail  Always       -       141058339
  3 Spin_Up_Time            0x0003   099   099   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       87
  5 Reallocated_Sector_Ct   0x0033   038   038   036    Pre-fail  Always       -       5054
  7 Seek_Error_Rate         0x000f   076   060   045    Pre-fail  Always       -       37158074
  9 Power_On_Hours          0x0032   093   093   000    Old_age   Always       -       6905 (238 47 0)
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       84
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   099   000    Old_age   Always       -       30065229831
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   062   032   040    Old_age   Always   In_the_past 38 (Min/Max 37/44 #97)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       10
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       34
193 Load_Cycle_Count        0x0032   093   093   000    Old_age   Always       -       15172
194 Temperature_Celsius     0x0022   038   068   000    Old_age   Always       -       38 (0 22 0 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       5895 (99 191 0)
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       6384400121
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       351446106
254 Free_Fall_Sensor        0x0032   001   001   000    Old_age   Always       -       23

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.


Или съм съвсем сляп, или не виждам нещата, които обяснява Наката: http://www.linux-bg.org/forum/index.php?topic=43458.msg263931#msg263931

Чудя се дали не прегрява, но никога не съм чувал за такова нещо. Кабел да е прецакан, няма как. Лаптопите нямат кабели.

Май, май си се оказва, че в днешно време всичко си е твърде китайско. Тоя диск буквално е полван няколко месеца. А като знам, че на стария ми лаптоп диска му не мръдна повече от 12 години и ми идва да полудея.[/code]


Титла: Re: Диагностика на твърд диск?
Публикувано от: jet в Апр 12, 2019, 03:16
188 Command_Timeout         0x0032   100   099   000    Old_age   Always       -       30065229831
не звучи добре:
This is a critical parameter. Degradation of this parameter may indicate serious problems with power supply or an oxidized data cable. Urgent data backup and hardware replacement is recommended.

  7 Seek_Error_Rate         0x000f   076   060   045    Pre-fail  Always       -       37158074
Although this parameter is not considered critical by the most hardware vendors, degradation of this parameter may indicate electromechanical problems of the disk. Regular backup is recommended.


254 Free_Fall_Sensor        0x0032   001   001   000    Old_age   Always       -       23
изглежда е падал 23 пъти

  5 Reallocated_Sector_Ct   0x0033   038   038   036    Pre-fail  Always       -       5054
This is a critical parameter. Degradation of this parameter may indicate imminent drive failure. Urgent data backup and hardware replacement is recommended.

Интересно е дали тези числа се променят с времето. И дали този лаптоп не е пил течност.


Титла: Re: Диагностика на твърд диск?
Публикувано от: go_fire в Апр 12, 2019, 07:16
Нямам спомени да съм го заливал. Ако е падала някаква вода, не ще да е била повече от няколко капки от мокри ръце например.  Но това не би трябвало да е стигало чак до диска, защото той е доста дълбоко скрит.

Всички тези неща, които видя набитото ти око, на мен не ми бяха направили впечатление. Диагнозата е ясна. В днешно време всичко е китайско, ползвайте облаци.


Титла: Re: Диагностика на твърд диск?
Публикувано от: 4096bits в Апр 12, 2019, 08:48
На един мой чисто нов лаптоп на три месеца му се прецака харда. Ходѝ чак до Полша, защото тук нямало сервиз. Разбира се, загубих всичкото дата. Този, който сложиха, беше леко по-шумен, но пък искара досега. Писах тук за него и казахте, че му било време - 38000+ часа било работа за сървърен диск.


Титла: Re: Диагностика на твърд диск?
Публикувано от: go_fire в Апр 12, 2019, 09:03
Видях това за падането и се зачудих. Съвременната техника е такава, че трудно понася и едно падане, второто със сигурност ще е фатално. Този лаптоп не е падал. При 23 падания щеше да е станал не на парчета, а на сол. Може би премествания под ъгъл ги отбелязва като падания.Обаче това за размагнетизираето Ачо и Наката го отбелязват като огромен проблем. Много съм тъп, как не съм го видял. Видял съм лоши сектори нула и съм се успокоил.

Следва важен за мен въпрос. Мога ли да ползвам този диск mount ro или въпреки това продължаващото въртене ще продължи да го размагнетизира до съвсем скорошен край? Проблема е в това, че не мога да си позволя да го заменя на този етап. Просто нямам нито лев наличен. Не, е, че много съм пристрастен към ВД, че си отвориха рисковете. Чудесно са направили, но продукцията им (макар и най-евтината на пазара) е безкрайно скъпа за средния селянин от ануса на Европа. От друга страна тукашните маймуни сме приучени на загуби, затова поредната няма да е никакъв проблем.

п.п. 4096, ако разбирам правилно, то моя диск трябва да е работил 6905 часа, което е девет месеца. Точно толкова са от края на август миналата година, когато го сложих. Спомняте си, че се похвалих, че съм минал на КДЕ 5. Това беше възможно, защото вече имах диск и можех да му сложа Девуан. Твоите 38 хил. според моя Емакс са по-малко от 4,5 години. Това е неприемливо. Никога в миналото дисковете не са работили по-малко от 10 години. Че то TLS на Убунту е повече. Ако ще е така, то по-добре дад ползваме облаци, по-евтино ще ни излезе.

Чувал съм, че в София се предлагат услуги за възстановяване на данни от напълно мъртви дискове. Отзивите са добри.


Титла: Re: Диагностика на твърд диск?
Публикувано от: 4096bits в Апр 12, 2019, 09:51
Чувал съм, че възстановяване на данни не е много евтино. Не говоря да направиш изображение на диска и да пуснеш две програми.
Можеш ли все още да четеш от харда?

При проблем от друго естество може да е предизвикал всичко. Бях му инсталирал Windows и не помня, какъв линукс първоначално и поради това най-големият дял, този за съхранение на данни беше в NTFS, след като разкарах Windows-а, NTFS дяла си остана и не съм го пипал. Никога не е дефрагментиран, а доста писане и четене е видял. Та може и механиката нещо да се е предала.


Титла: Re: Диагностика на твърд диск?
Публикувано от: go_fire в Апр 12, 2019, 11:27
Чувал съм, че възстановяване на данни не е много евтино. Не говоря да направиш изображение на диска и да пуснеш две програми.
Можеш ли все още да четеш от харда?

При проблем от друго естество може да е предизвикал всичко. Бях му инсталирал Windows и не помня, какъв линукс първоначално и поради това най-големият дял, този за съхранение на данни беше в NTFS, след като разкарах Windows-а, NTFS дяла си остана и не съм го пипал. Никога не е дефрагментиран, а доста писане и четене е видял. Та може и механиката нещо да се е предала.

Не знам, колко е скъпо, ама го знам от габровец. Колко да е скъпо?

Доколкото разбирам, процеса е следния. Диска се разглобява. Плочите се слагат на „стенд“, където се развъртат. Главата многократно минава, защото дори сектора да е лош, около него има „осколки“ (да наистина подобно на взривена граната). Следват някакви магии по сглобяването със специализиран софтуер (май има и свободен такъв). Накрая ти изпичат всичко на DVD-та и ти го връчват.


Титла: Re: Диагностика на твърд диск?
Публикувано от: n00b в Апр 12, 2019, 11:28
Е как можеш при такъв SMART светещ като коледна елха да ми обясняваш, че няма нищо подозрително.

Марш да си направиш архиви, че диска е пътник!


Титла: Re: Диагностика на твърд диск?
Публикувано от: go_fire в Апр 12, 2019, 11:35
Нууб това е разликата между нас. Ти си професионалист. Аз съм гледал S.M.A.R.T. пет пъти в живота си. Това, на което казваш елха, аз виждам почти само нули. Ако не беше Джет да ми обърне внимание на няколко числа, изобщо нямаше да ги забележа. Имената им звучат много невинно. Но може би трябваше първо да потърся, какво значат тези имена. Това е. Ламерия. Няма оправия  :(


Титла: Re: Диагностика на твърд диск?
Публикувано от: Naka в Апр 12, 2019, 13:52
Гога е те това ти е проблема.

Цитат
5 Reallocated_Sector_Ct   0x0033   038   038   036    Pre-fail  Always       -       5054

Сменил е цели 5054 сектора със нови. Диска трябва да има такива такива релокирани сектори или 0 или да не са повече от 100- тина. Чудно защо още не почнал да ги отбелязва в 197 Current_Pending_Sector или в 198 Offline_Uncorrectable.

Това да развива непрекъснато   Reallocated_Sector си е типичен сегейтски проблем
Бакупвай си всичко ценно. Следи го този параметър дето е на 5054 сектора дали не се увеличава. Обикновенно като почнат да скачат скачат всеки ден (или през седмица) по няколко...
И си пусни едно dd на четене на целият диск да видиш дали няма да избие. Избива като настъпи лош сектор и също се отбелява в dmesg.



Цитат
Съвременната техника е такава, че трудно понася и едно падане, второто със сигурност ще е фатално. Този лаптоп не е падал. При 23 падания щеше да е станал не на парчета, а на сол. Може би премествания под ъгъл ги отбелязва като падания.

Не е изобщо падания, сътресения, работа под ъгъл, магнити и др. Много са здрави на такива неща. Нещо вътрешно ще да е.

Един път един сеагейт дето имаше Reallocated_Sector_Cт 0 броя, в един прекрасен ден почна да ги развива. единият ден бяха 10 следващият 12, след два три дена 20, след една седмица 80. след това почна да се взривява, 100 -200 -500. И понеже като ги знам какви и им са гаранциите на наште ганьовци и как се циганят - реших да го доубия та да нямат причини да откажат гаранцията.


Чуках го, въртях го..... тръсках го.........както работи..... Нищо абсолютно нищо. Та тогава разбрах че са много здрави. :) Пробвах и неодимови магнити...... Пак абсолютно нищо...Всички дискове имат магнитен екран отгоре и са много защитени.

Обаче няма да ви кажа как го доубих. >:D



Титла: Re: Диагностика на твърд диск?
Публикувано от: Acho в Апр 12, 2019, 13:56
Най-добре е тръгналия диск да се смени. Ако има парички за нов, не го чакай да се скапе докрай.


Титла: Re: Диагностика на твърд диск?
Публикувано от: laskov в Апр 12, 2019, 14:25
...
Следва важен за мен въпрос. Мога ли да ползвам този диск mount ro
...
Не можеш. ОС постоянно ще се мъчи да прочете нещо и ще ти бави всичко.

Цитат
Чувал съм, че в София се предлагат услуги за възстановяване на данни от напълно мъртви дискове. Отзивите са добри.
Твоят не е напълно мъртъв. Това дето го пишете със стендовете (не бях чувал), е за диск с умряла електроника.
Твоето решение за спасяване на данни е ddrescue, но трябва да имаш свободен диск със същия обем, стационарен компютър, на който да ги закачиш и двата и зареждащ диск SystemRescueCD.

На мой познат преди много време му бях изпекъл един жив диск. Махнах твърдия диск от лаптопа му и така той го ползваше повече от година. Сигурно и сега е вариант с качествена флашка и/или данни в облака.

PS: Вместо флашка може да е SD или xD карта.


Титла: Re: Диагностика на твърд диск?
Публикувано от: makeme в Апр 12, 2019, 14:30
И моето мнение е за смяна.

Искам обаче да използвам темата да попитам нещо. Както знаете имам едно скрипче за такива ситуации (lazy-smartctl ($2))  и не мога да си реша един проблем с awk. Става въпрос за следния ред (ще използвам изхода на go_fire, понеже тук ми се появи също):
Код:
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       6384400121

Аз го режа така в скрипта:
Код
GeSHi (Bash):
  1. awk '{$10=$10/32; print $10}'

И получавам това:

Код
GeSHi (Bash):
  1. $ echo "6384400121" | awk '{$1=($1/32); print $1}'
  2. 1.99513e+08

Та въпросът ми е:
Нещо от десетичната запетая ли се бъгва, или съм използвал простотия за решение?

ПП: Сега видях, че изхода от смарта на go_fire е в битове и го коригирах на "awk '{$10=$10/8/1024/1024; print $10}'", но въпросът ми остава. Защо awk не може да раздели правилно числото?


Титла: Re: Диагностика на твърд диск?
Публикувано от: Naka в Апр 12, 2019, 14:47
Та въпросът ми е:
Нещо от десетичната запетая ли се бъгва

Защо? какво не е наред. Просто получаваш резултата с плаваща запетая.

1.99513e+08 = 199512503

ако искаш целочислени резултати това може да стане с bc. но сигурно има и други начини за форматиране на изхода в или без плаваща запетая. Може би
print $1 да има опции...или printf ?

Код:
[naka@home ~]$ bc
bc 1.06.95
Copyright 1991-1994, 1997, 1998, 2000, 2004, 2006 Free Software Foundation, Inc.
This is free software with ABSOLUTELY NO WARRANTY.
For details type `warranty'.
6384400121 / 32
199512503



Титла: Re: Диагностика на твърд диск?
Публикувано от: makeme в Апр 12, 2019, 14:55
Не можах да разбера. Защо при единия случай ми връща каквото трябва, а в другия не?

Цитат
echo "6384400121" | awk '{$1=($1/8/1024/1024); print $1}'
761.08

echo "6384400121" | awk '{$1=($1/32); print $1}'
1.99513e+08


Цитат
echo '6384400121/8/1024/1024' | bc -l
761.07980263233184814453
$ echo '6384400121/32' | bc -l
199512503.78125000000000000000


Работи само до втората цифра след запетаята ли ? И ако да, защо в единият случай закръгля , а в другият - не?
ПП: Или по-добре зададен въпроса: Защо в единият случай ми връща добре закръглен резултат, а в другият, такъв с плаваща запетая?


Титла: Re: Диагностика на твърд диск?
Публикувано от: Naka в Апр 12, 2019, 16:19
А така?

Код:
[naka@home ~]$ echo "6384400121" | awk '{$1=($1/32); printf "%d\n",$1}'
199512503


във вторият случай числото става твърде голямо/дълго и обикновенният print решава че е по добре да го представи на екрана като плаваща запетая.
 


Титла: Re: Диагностика на твърд диск?
Публикувано от: makeme в Апр 12, 2019, 16:44
А така?

Код:
[naka@home ~]$ echo "6384400121" | awk '{$1=($1/32); printf "%d\n",$1}'
199512503


във вторият случай числото става твърде голямо/дълго и обикновенният print решава че е по добре да го представи на екрана като плаваща запетая.

Много благодаря, Нака. Точно това търсих. Благодарение на теб ги намерих опциите. Тази, която ми трябваше е:
Цитат
`f'    This prints a number in floating point notation.

.. а то явно по подразбиране работи с това:

Цитат
`g'    This prints a number in either scientific notation or floating point notation, whichever uses fewer characters.

Ето и най-после нормален изход на харда на go_fire:

(https://raw.githubusercontent.com/makemegit/lazy-smartctl/master/pics/lazy-smartctl_GF.png)


Титла: Re: Диагностика на твърд диск?
Публикувано от: n00b в Апр 12, 2019, 17:20
Гога е те това ти е проблема.

Цитат
5 Reallocated_Sector_Ct   0x0033   038   038   036    Pre-fail  Always       -       5054

Сменил е цели 5054 сектора със нови. Диска трябва да има такива такива релокирани сектори или 0 или да не са повече от 100- тина. Чудно защо още не почнал да ги отбелязва в 197 Current_Pending_Sector или в 198 Offline_Uncorrectable.


ТИ ЧАКАШ ДО 100 ЛОШИ СЕКТОРА? Аз ги менкам и при 2-3...


Титла: Re: Диагностика на твърд диск?
Публикувано от: makeme в Апр 12, 2019, 17:28
@Naka тук ($2) и тук ($2) обяснява защо ги чака и какъв е принципът и последователността на грешките (реално това не показва лоши сектори). Иначе аз лично действам като теб, ако е на сървър, но на личните устройства си следвам неговия принцип.