Автор Тема: Проблем с HDD след спиране на сървъра  (Прочетена 4799 пъти)

nslave

  • Напреднали
  • *****
  • Публикации: 159
  • Distribution: Fedora / Debian
  • Window Manager: Xfce
    • Профил
Re: Проблем с HDD след спиране на сървъра
« Отговор #15 -: Dec 27, 2023, 15:38 »
И на мен ми звучи като кофти sata кабел или кофти напъхан такъв. Другият вариант е хард диска да е кофти, това че е нов не пречи да е дефектен. Може да му пуснеш smart тест когато успееш да boot-неш с него. Другото, което ми се струва твърде малко вероятно е захранването да не стига. Може да разгледаш колко вата е захранването и да направиш груба сметка дали е достатъчно за допълнително добавените дискове.
Активен

ivanovslavy

  • Напреднали
  • *****
  • Публикации: 58
    • Профил
Re: Проблем с HDD след спиране на сървъра
« Отговор #16 -: Dec 27, 2023, 16:37 »
Цитат
Само едно е странното тука, как така при старт не тръгва? А със рестарт тръгва, чете пише трие всичко му е нормално? Това е много странното за мен

При рестарт диска не спира и продължава да върти. А при shutdown му се изключва захранването и всичко почва наново - Развъртане на диска инициализация/вътрешен ресет на електрониката на диска...
Аз неразбирам от хардуер чак толкова, може ли да ми разясните малко по-подробно това което казвате - Развъртане на диска инициализация/вътрешен ресет на електрониката на диска...
За мен един диск или тръгва или не! През живота ми не съм имал средно положение... хаха... Като сегашното.... Имал съм прецакани дискове и преди и те просто спират и се махат от употреба. Сегашния 16ТБ Тошиба смятам че е повреден нещо защото направих всички възможни тестове за които ме посъветвахте по-горе + всичко което аз се сетих а именно:
- Проверка на целия лог от стартиране на кърнела, който е около 3к и нещо си реда и в него има запис на това как се проваля чека на устройството и съответно последващите грешки на всички услуги свързани с този хард диск, защото просто UUID-то на харда го няма и неможе да бъде открито
- Спиране на всички услуги които са пуснати в сървъра
- Безброй спирания и рестарти
- Влизане в БИОС и зареждането на фабрични настройки за БИОС
- Отваряне на кутията и тестове за старт по всички възможни начини за закачене на хард диск към дъното, с един диск, с два диска, с два различни кабела на двата различни САТА порта налични на дънната платка, различни захранващи кабели
- Тестване със друг хард диск - открит от БИОС разбира се безпроблемно от първия път
Резултата е един и същ - от изключено положение харда не се открива а след рестарт тръгва и работи. Никаква промяна от сутринта. Пробвах да се свържа с фирмата продала ми хард диск - номера на абоната е изключен или извън обхват!
И сега съм го пуснал да "работи" и да вадя инфото поне от него, доколкото ми е възможно впредвид големината му...
И така лош опит със Тошиба добивам, цената му не е никак малка а агентите дето ми го продадоха немога да ги открия днес. Надявам се, че просто почиват тези дни и ще се върнат след НГ на работа. Мога да споделя името на фирмата ако искате. Другото лошо е че ми загубиха целият ден в мотаене и спиране работата на сървъра! Въпреки всичко се надявам да го подменат с нов или да ми върнат парите да си купя от другаде защото ми е необходим. Както и наистина ме интерисива дали подобна повреда е поправима или твърдо НЕ. За мен след всички тестове хард диска не функционира правилно и аз не го искам. Благодаря на всички които се опитахте да помегнете. Няма да Ви споделям информации от логове, снимки от БИОС-а или от Линукс терминала, но имам такива и ще ги пратя с един имейл на фирмата за да знаят какъв боклук ми продадоха.
Активен

ivanovslavy

  • Напреднали
  • *****
  • Публикации: 58
    • Профил
Re: Проблем с HDD след спиране на сървъра
« Отговор #17 -: Dec 27, 2023, 16:46 »
И на мен ми звучи като кофти sata кабел или кофти напъхан такъв. Другият вариант е хард диска да е кофти, това че е нов не пречи да е дефектен. Може да му пуснеш smart тест когато успееш да boot-неш с него. Другото, което ми се струва твърде малко вероятно е захранването да не стига. Може да разгледаш колко вата е захранването и да направиш груба сметка дали е достатъчно за допълнително добавените дискове.
Считам че DELL са изчислили да има захранване за два допълнителни диска, даже готови закачени кабели са ми оставили вътре!
И аз тайничко се надявах да е някой кабел, но честно казано не го вярвах!
Иначе пуснах чек разбира се:
$ sudo fsck /dev/sdb
[sudo] password for slavy:
fsck from util-linux 2.37.2
e2fsck 1.46.5 (30-Dec-2021)
/dev/sdb: clean, 1574/488308736 files, 130228641/3906469888 blocks
Няма проблеми според теста по този хард!
Поздрави!

Едит: Споделям модел и марка на диска за да имате едно наум ако решите, че точно такъв искате да си купите!
TOSHIBA MG08ACA1
Това е 16TB MG Enterprise, 7200 оборота, 512МБ кеш.
« Последна редакция: Dec 27, 2023, 17:04 от ivanovslavy »
Активен

Nik123

  • Напреднали
  • *****
  • Публикации: 3128
  • Distribution: Mageia, Q4OS
    • Профил
Re: Проблем с HDD след спиране на сървъра
« Отговор #18 -: Dec 27, 2023, 17:07 »
Колега, ако дискът е повреден, можеш да направиш рекламация на търговеца в 14-дневен срок от доставката (тук имам предвид, ако търговецът е български, както предполагам, доп. и че си поръчал диска онлайн). Търговецът може да си избере едно от двете- да ти смени харда с изправен, или да ти върне парите. Ако се съгласи да ти подмени стоката с изправна, не можеш да искаш връщане на парите. Като се свържеш с него, предполагам, че няма да откаже замяна. Ако дискът е дефектен, разходите по връщането на тоя повредения и замяната му с изправен (разбирай цената на куриерската услуга) е за сметка на търговеца. Т.е. го изпращаш обратно за сметка на получателя. Може да сложиш и разпечатано на някой лист вътре едно описание на проблема. Аз така съм връщал дефектна РАМ- памет.

П.П. Предполагам, че си пазиш товарителницата, фактурата и касовия бон. Като връщаш харда, с него изпращаш копия на тези документи, оригиналите си ги задръж за себе си, за всеки случай.

П.П.П. А диска като физическо лице ли го закупи, или на името на фирма някаква?
« Последна редакция: Dec 27, 2023, 17:41 от Nik123 »
Активен

ivanovslavy

  • Напреднали
  • *****
  • Публикации: 58
    • Профил
Re: Проблем с HDD след спиране на сървъра
« Отговор #19 -: Dec 27, 2023, 18:24 »
Колега, ако дискът е повреден, можеш да направиш рекламация на търговеца в 14-дневен срок от доставката (тук имам предвид, ако търговецът е български, както предполагам, доп. и че си поръчал диска онлайн). Търговецът може да си избере едно от двете- да ти смени харда с изправен, или да ти върне парите. Ако се съгласи да ти подмени стоката с изправна, не можеш да искаш връщане на парите. Като се свържеш с него, предполагам, че няма да откаже замяна. Ако дискът е дефектен, разходите по връщането на тоя повредения и замяната му с изправен (разбирай цената на куриерската услуга) е за сметка на търговеца. Т.е. го изпращаш обратно за сметка на получателя. Може да сложиш и разпечатано на някой лист вътре едно описание на проблема. Аз така съм връщал дефектна РАМ- памет.

П.П. Предполагам, че си пазиш товарителницата, фактурата и касовия бон. Като връщаш харда, с него изпращаш копия на тези документи, оригиналите си ги задръж за себе си, за всеки случай.

П.П.П. А диска като физическо лице ли го закупи, или на името на фирма някаква?


Аз писах имейл на продавача току що. Поръчката е направена на 18.12.23 през български интернет магазин, просто днес открих дефекта в него.
Точно това и аз поисках - нов хард или да ми върнат парите. Имам гаранционна карта 60 месеца! Надявам се утре да работят и да се чуем да видим какво ще го правим. Ще пиша тук да кажа какво е станало след като разговарям с тях. Благодаря за съветите, надявам се да излезат разбрани продавачите и да не ми създават допълнителни главоболия и губене на време. Лека!
Активен

Acho

  • Напреднали
  • *****
  • Публикации: 5296
  • Distribution: Slackware, MikroTik - сървърно
  • Window Manager: console only
    • Профил
    • WWW
Re: Проблем с HDD след спиране на сървъра
« Отговор #20 -: Dec 27, 2023, 18:54 »
Гаранцията е 60 месеца (5 години), а той изкарал една седмица................егати и качеството.
Активен

CPU - Intel Quad-Core Q8400, 2.66 GHz; Fan - Intel Box; MB - Intel G41M-T2; RAM - DDR2-800, Kingston HyperX, 2X2048 MB; VC - onboard, Intel G41 Express Chipset; HDD - Toshiba, 500 GB, SATAII; SB - Realtek HD Audio; DVD-RW - TSSTcorp DVD-RW; LAN - Realtek PCI-E GBE Controller; PSU - Fortron 350 Watt.

ivanovslavy

  • Напреднали
  • *****
  • Публикации: 58
    • Профил
Re: Проблем с HDD след спиране на сървъра
« Отговор #21 -: Dec 27, 2023, 18:56 »
Сещам се да Ви попитам и нещо друго:
Принципно съм купувал не малко нови дискове, всеки идва без таблица, файлова система и UUID - така и трябва да бъде, така дойде и този, и аз си създадох ext4 и тогава му се появи и UUID-то. Та възможно ли е когато има вече създадена файлова система и UUID, те да бъдат напълно премахнати и да го видя като нов. Мисълта ми клони към това дали да си мисля, или си въобразявам, че е възможно продавача да е знаел за дефекта и да се е опитал да го прикрие при продажбата?
Активен

Acho

  • Напреднали
  • *****
  • Публикации: 5296
  • Distribution: Slackware, MikroTik - сървърно
  • Window Manager: console only
    • Профил
    • WWW
Re: Проблем с HDD след спиране на сървъра
« Отговор #22 -: Dec 27, 2023, 19:08 »
Всичко е възможно. Ама нали си има SMART параметри. Ако е възможно прочетете в SMART таблицата времето на работа (колко часа) и броя на стартиранията на дискчето. С някакъв тул, или със smartctl /dev/sda (или там какъвто е дивайса).
Активен

CPU - Intel Quad-Core Q8400, 2.66 GHz; Fan - Intel Box; MB - Intel G41M-T2; RAM - DDR2-800, Kingston HyperX, 2X2048 MB; VC - onboard, Intel G41 Express Chipset; HDD - Toshiba, 500 GB, SATAII; SB - Realtek HD Audio; DVD-RW - TSSTcorp DVD-RW; LAN - Realtek PCI-E GBE Controller; PSU - Fortron 350 Watt.

Naka

  • Напреднали
  • *****
  • Публикации: 3402
    • Профил
Re: Проблем с HDD след спиране на сървъра
« Отговор #23 -: Dec 27, 2023, 20:09 »
Според мен диска е за гаранция. Имал съм такива дискове - не винаги ги открива, когато ги открие работи изключително изправно. Това положение може да продължи с години.
Ако е проблем с развъртането имаше един параметър в смарта, който го отразява - беше нещо от рода на колко пъти при подадено захранване диска не е тръгнал.  Така че си виж смарта.

Товаа са най гадните повреди, когато нещо 'полу' работи.... И почва едно надлъгване с търговеца... Ти му разправяш че не работи... Той ти доказва че нищо му няма. Отива в сервиза 'техника' там го пуска за 3 минути. Диска тръгва и ти го връщат че нищо му няма.

« Последна редакция: Dec 27, 2023, 20:16 от Naka »
Активен

Perl - the only language that looks the same before and after encryption.

Naka

  • Напреднали
  • *****
  • Публикации: 3402
    • Профил
Re: Проблем с HDD след спиране на сървъра
« Отговор #24 -: Dec 27, 2023, 20:15 »
Сещам се да Ви попитам и нещо друго:
Принципно съм купувал не малко нови дискове, всеки идва без таблица, файлова система и UUID - така и трябва да бъде, така дойде и този, и аз си създадох ext4 и тогава му се появи и UUID-то. Та възможно ли е когато има вече създадена файлова система и UUID, те да бъдат напълно премахнати и да го видя като нов.

Откриването на диска като устройствов биоса или кърнела (например lsblk) няма нищо общо с това което е записано на диска, няма нищо общо с форматирането, uuid, ext4, партишъните и т. Н. И да го търкаш и да го преформатираш все тая.


Ако искаш да затриеш всичко и да го видиш като чисто нов, все едно току що е излязал от завода - е едно dd с нули. Не е нужно да го чакаш целия. Трябва само 3,4 секунди да затърка началните сектори.


Това което можеш да направиш е когато не тръгне е да напишеш едно lsblk и да го видиш дали физически е там, също може да разгледаш dmesg да видиш дали при бутването кърнела го е  открил
« Последна редакция: Dec 27, 2023, 20:29 от Naka »
Активен

Perl - the only language that looks the same before and after encryption.

remotexx

  • Напреднали
  • *****
  • Публикации: 3244
    • Профил
Re: Проблем с HDD след спиране на сървъра
« Отговор #25 -: Dec 27, 2023, 21:00 »
и другите ми 5 цента

1. Тия големите дискове - хеле па външните (с вериткалния запис) не са за сървъри - тея са предимно за бакъп и там ... снимки/видеа от сватби погребения, но честото писане ги прецаква бързо (че презаписват и съседни 5-6 сектора на тоя дето се модифицира)

2. влез в БИОСа и махни всички опции там за бърз ре/старт които намериш, после направи същото и в ОС която зареждаш ...външните УСБ дискове бая време припалват (от студент старт, а при рестарт той вече е подгрял)

3. Виждам че ОС ти е на NVMe и вероятно зарежда прекалено бързо, т.е. той вънкашния диск като си се развърти и ще се монтира, но междувременно ОС вече ти е заредила и е пробавала да подкара услугите (няколко пъти) и е фейлнала.. сега виждал съм (но не знам как се прави) на услуга да и се казва да чака друга услуга да се зареди преди и тя да се стартира или изключи (аз съм го виждал най-вече при изкл. - "чакам/е едикоя си услуга да приключи 3мин или 5 мин" и след това хард рестарт - да е приключила овреме) - та да си спомняш да си инсталирал нещо ръчно там от тия твоите услуги - защото обик. ако не си пипал ръчно (да създаваш some.service файл/скрипт) то тия по-подразбиране си знаят и си изчакват колкото си требе минути..

4. На външно захранване ли е външния диск (ако е външен де) - пробвай преди студен старт да му изкл./вкл. ръчно захранването (препдолагам ще почне да се инициализира и ще сколаса до студения старт) - един вид да изкл. лош тайминг, но ако е от това пак попраме до т.3.

т.е. първото нещо е да се разбере дали грешката е при изкл. т.е. некой услуги още пишат по времем на изкл. (и там да се добави в сервизните файлове - "изчаквам сервиза да прикл. 5 мин") или е при вкл. (кофти тайминг и нужда от изчакване да припали), а може да е и от двете едновременно  ???

--
Ето затова хората си купуват сървърни дискове - нищо чудно (тъй като записът е много по-бавен) още да пише при шътдаун (а то NVMe-то за секунди и е приключило докато сервизите ти още изпразват кешове по външния диск)

https://en.wikipedia.org/wiki/Shingled_magnetic_recording
The overlapping-tracks architecture complicates the writing process, since writing to one track also overwrites an adjacent track. If adjacent tracks contain valid data, they must be rewritten as well. As a result, SMR drives are divided into many append-only (sequential) zones of overlapping tracks that need to be rewritten entirely when full, resembling flash blocks in solid-state drives.

Магнитен широк запис (SMR)

Магнитният запис в широк вид (Shingled Magnetic Recording]]) е техника на запис/четене на магнитни данни, използвана в някои твърди дискове за увеличаване на радиалната плътност на записа и общия капацитет за съхранение на диска. Увеличаването на задържащата (коерцитивната) сила на магнитното покритие на единичния магнитен диск изисква по-силно магнитно поле за пренамагнитването му. При технологията SMR това се постига с магнитна глава за запис, която е по-широка от тази за четене и припокрива част от съседната пътека. [2] По този начин при записът на всяка една пътека се изтрива и част от записа на съседната пътека.

При стандартния магнитен запис отделните пътеки за магнитния запис са паралелни и отделени на определено разстояние, така че да не си влияят по време на запис и четене. При новия метод на запис припокриването при запис позволява получаването на пътеки със записана информация по-тесни от широчината на записващата глава. Това позволява увеличение на обема на записаната информация с 25 процента.

Поради това, че при запис се засяга и съседната пътека, се променя начинът на записване. При запис трябва да се презаписват и засегнатите пътеки. Това прави процеса на запис много по-бавен от четенето. Има различни начини за организация на работа. Тези устройства естествено са подходящи за архивиране, тъй като скоростта на процеса на четене на информацията не се намалява.



--
т.е. това което не казват е - Тези устройства не са подходящи за сървър с многото писане и т.н.
..ама то кой ли външен диск е подходящ за сървър, но вече ще знаеш че и някой вътрешни не стават - то си требе сървърен диск за сървъра
друг път като вземаш голям диск гледай да не е с Shingles  :P

--
https://www.howtogeek.com/803276/cmr-vs.-smr-hard-drives-whats-the-difference/
So Is SMR Bad? Which Drive Type Should I Choose?

Whether SMR is bad or not is a subjective call. If you want massive amounts of storage for less money and you don't mind the performance penalties involved, an SMR drive might be an OK choice for you. Typically, a 16TB SMR drive costs less than a 16 TB CMR drive, for example. If you use a drive for occasional single-disk backups, an SMR drive might be fine.
« Последна редакция: Dec 27, 2023, 21:21 от remotexx »
Активен

remotexx

  • Напреднали
  • *****
  • Публикации: 3244
    • Профил
Re: Проблем с HDD след спиране на сървъра
« Отговор #26 -: Dec 27, 2023, 21:30 »
Сега проверих твоя все пак е от по-хубавите CMR - не е SMR, обаче все пак са вкарали и некви нови екстри - TDMR
https://en.wikipedia.org/wiki/Two-dimensional_magnetic_recording


по-интереснтоо е че на официалния сайт информация нъцки та трябваше от бета тестери да изровя
https://www.kitguru.net/components/hard-drives/simon-crisp/toshiba-mg08-mg08aca16te-16tb-hdd-review/

П.П. Аз така като се зачетох това TDMR е колкото да не си признаят че е SMR (че хората спряха да им ги купуват)
« Последна редакция: Dec 27, 2023, 22:15 от remotexx »
Активен

ivanovslavy

  • Напреднали
  • *****
  • Публикации: 58
    • Профил
Re: Проблем с HDD след спиране на сървъра
« Отговор #27 -: Dec 27, 2023, 21:57 »
Сещам се да Ви попитам и нещо друго:
Принципно съм купувал не малко нови дискове, всеки идва без таблица, файлова система и UUID - така и трябва да бъде, така дойде и този, и аз си създадох ext4 и тогава му се появи и UUID-то. Та възможно ли е когато има вече създадена файлова система и UUID, те да бъдат напълно премахнати и да го видя като нов.

Откриването на диска като устройствов биоса или кърнела (например lsblk) няма нищо общо с това което е записано на диска, няма нищо общо с форматирането, uuid, ext4, партишъните и т. Н. И да го търкаш и да го преформатираш все тая.



Ако искаш да затриеш всичко и да го видиш като чисто нов, все едно току що е излязал от завода - е едно dd с нули. Не е нужно да го чакаш целия. Трябва само 3,4 секунди да затърка началните сектори.


Това което можеш да направиш е когато не тръгне е да напишеш едно lsblk и да го видиш дали физически е там, също може да разгледаш dmesg да видиш дали при бутването кърнела го е  открил

Със lsblk го няма когато не е тръгнал, пробвах го.
Значи щом може да го дадат да изглежда нов, нищо чудно и да са знаели за проблема.

Според мен диска е за гаранция. Имал съм такива дискове - не винаги ги открива, когато ги открие работи изключително изправно. Това положение може да продължи с години.
Ако е проблем с развъртането имаше един параметър в смарта, който го отразява - беше нещо от рода на колко пъти при подадено захранване диска не е тръгнал.  Така че си виж смарта.

Товаа са най гадните повреди, когато нещо 'полу' работи.... И почва едно надлъгване с търговеца... Ти му разправяш че не работи... Той ти доказва че нищо му няма. Отива в сервиза 'техника' там го пуска за 3 минути. Диска тръгва и ти го връщат че нищо му няма.
Смарт никога не съм ползвал, сега ще се информирам, ще го направя и ще шерна инфо, иначе за сервиза съм абсолютно съгласен с тебе, дано не се окажа в тази тъпата ситуация за която говориш и да тръгне един спор с продавача...
и другите ми 5 цента

1. Тия големите дискове - хеле па външните (с вериткалния запис) не са за сървъри - тея са предимно за бакъп и там ... снимки/видеа от сватби погребения, но честото писане ги прецаква бързо (че презаписват и съседни 5-6 сектора на тоя дето се модифицира)

2. влез в БИОСа и махни всички опции там за бърз ре/старт които намериш, после направи същото и в ОС която зареждаш ...външните УСБ дискове бая време припалват (от студент старт, а при рестарт той вече е подгрял)

3. Виждам че ОС ти е на NVMe и вероятно зарежда прекалено бързо, т.е. той вънкашния диск като си се развърти и ще се монтира, но междувременно ОС вече ти е заредила и е пробавала да подкара услугите (няколко пъти) и е фейлнала.. сега виждал съм (но не знам как се прави) на услуга да и се казва да чака друга услуга да се зареди преди и тя да се стартира или изключи (аз съм го виждал най-вече при изкл. - "чакам/е едикоя си услуга да приключи 3мин или 5 мин" и след това хард рестарт - да е приключила овреме) - та да си спомняш да си инсталирал нещо ръчно там от тия твоите услуги - защото обик. ако не си пипал ръчно (да създаваш some.service файл/скрипт) то тия по-подразбиране си знаят и си изчакват колкото си требе минути..

4. На външно захранване ли е външния диск (ако е външен де) - пробвай преди студен старт да му изкл./вкл. ръчно захранването (препдолагам ще почне да се инициализира и ще сколаса до студения старт) - един вид да изкл. лош тайминг, но ако е от това пак попраме до т.3.

т.е. първото нещо е да се разбере дали грешката е при изкл. т.е. некой услуги още пишат по времем на изкл. (и там да се добави в сервизните файлове - "изчаквам сервиза да прикл. 5 мин") или е при вкл. (кофти тайминг и нужда от изчакване да припали), а може да е и от двете едновременно  ???

--
Ето затова хората си купуват сървърни дискове - нищо чудно (тъй като записът е много по-бавен) още да пише при шътдаун (а то NVMe-то за секунди и е приключило докато сервизите ти още изпразват кешове по външния диск)

https://en.wikipedia.org/wiki/Shingled_magnetic_recording
The overlapping-tracks architecture complicates the writing process, since writing to one track also overwrites an adjacent track. If adjacent tracks contain valid data, they must be rewritten as well. As a result, SMR drives are divided into many append-only (sequential) zones of overlapping tracks that need to be rewritten entirely when full, resembling flash blocks in solid-state drives.

Магнитен широк запис (SMR)

Магнитният запис в широк вид (Shingled Magnetic Recording]]) е техника на запис/четене на магнитни данни, използвана в някои твърди дискове за увеличаване на радиалната плътност на записа и общия капацитет за съхранение на диска. Увеличаването на задържащата (коерцитивната) сила на магнитното покритие на единичния магнитен диск изисква по-силно магнитно поле за пренамагнитването му. При технологията SMR това се постига с магнитна глава за запис, която е по-широка от тази за четене и припокрива част от съседната пътека. [2] По този начин при записът на всяка една пътека се изтрива и част от записа на съседната пътека.

При стандартния магнитен запис отделните пътеки за магнитния запис са паралелни и отделени на определено разстояние, така че да не си влияят по време на запис и четене. При новия метод на запис припокриването при запис позволява получаването на пътеки със записана информация по-тесни от широчината на записващата глава. Това позволява увеличение на обема на записаната информация с 25 процента.

Поради това, че при запис се засяга и съседната пътека, се променя начинът на записване. При запис трябва да се презаписват и засегнатите пътеки. Това прави процеса на запис много по-бавен от четенето. Има различни начини за организация на работа. Тези устройства естествено са подходящи за архивиране, тъй като скоростта на процеса на четене на информацията не се намалява.



--
т.е. това което не казват е - Тези устройства не са подходящи за сървър с многото писане и т.н.
..ама то кой ли външен диск е подходящ за сървър, но вече ще знаеш че и някой вътрешни не стават - то си требе сървърен диск за сървъра
друг път като вземаш голям диск гледай да не е с Shingles  :P

--
https://www.howtogeek.com/803276/cmr-vs.-smr-hard-drives-whats-the-difference/
So Is SMR Bad? Which Drive Type Should I Choose?

Whether SMR is bad or not is a subjective call. If you want massive amounts of storage for less money and you don't mind the performance penalties involved, an SMR drive might be an OK choice for you. Typically, a 16TB SMR drive costs less than a 16 TB CMR drive, for example. If you use a drive for occasional single-disk backups, an SMR drive might be fine.
Диска е вътрешен. Не бих сложил външен такъв та дори и на домашния си сървър! Производителя казва, че тази серия е направена за работа 24/7, нон стап без прекъсване там незним си колко десетки хиляди часове. Просто на мене ми пратиха счупен такъв или дефектен. Добре че го установих бързо и не е пълен с инфо, или пък да спре с нещо важно вътре!
Линукса и скоростта на зареждане на системата няма общо с тази грешка колега, още в началото БИОС-а не го открива и съответно после нищо не го открива също.
Сега да видим този Смарт как работи  за който ме съветват колегите по-горе и ще пусна репорта.
Лека.
Активен

ivanovslavy

  • Напреднали
  • *****
  • Публикации: 58
    • Профил
Re: Проблем с HDD след спиране на сървъра
« Отговор #28 -: Dec 27, 2023, 22:11 »
Всичко е възможно. Ама нали си има SMART параметри. Ако е възможно прочетете в SMART таблицата времето на работа (колко часа) и броя на стартиранията на дискчето. С някакъв тул, или със smartctl /dev/sda (или там какъвто е дивайса).
Смарта стана бързо. Малко е дълъг  репорта, но все пак ще го пусна тука и се надявам да помегнете с разчитането му, понеже аз не съм го правил до сега. Никога не ми се е налагало, до сега. :D
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       151
Предполагам това са работните му часове, което считам отговаря на времето стоял в моите ръце!
Също ми направи сега впечатление последният ред от този чек:
If Selective self-test is pending on power-up, resume after 0 minute delay.
Превеждам си го много добре, но не ми е ясно като функция тая тъпотия!


sudo smartctl -a /dev/sdb
smartctl 7.2 2020-12-30 r5155 [x86_64-linux-5.15.0-91-generic] (local build)
Copyright (C) 2002-20, Bruce Allen, Christian Franke, http://www.smartmontools.org

=== START OF INFORMATION SECTION ===
Device Model:     TOSHIBA MG08ACA16TE
Serial Number:    7360A05HFVGG
LU WWN Device Id: 5 000039 ca8c81a7f
Firmware Version: 0103
User Capacity:    16,000,900,661,248 bytes [16.0 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    7200 rpm
Form Factor:      3.5 inches
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.3, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Wed Dec 27 20:03:07 2023 UTC
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x80)   Offline data collection activity
               was never started.
               Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)   The previous self-test routine completed
               without error or no self-test has ever
               been run.
Total time to complete Offline
data collection:       (  120) seconds.
Offline data collection
capabilities:           (0x5b) SMART execute Offline immediate.
               Auto Offline data collection on/off support.
               Suspend Offline collection upon new
               command.
               Offline surface scan supported.
               Self-test supported.
               No Conveyance Self-test supported.
               Selective Self-test supported.
SMART capabilities:            (0x0003)   Saves SMART data before entering
               power-saving mode.
               Supports SMART auto save timer.
Error logging capability:        (0x01)   Error logging supported.
               General Purpose Logging supported.
Short self-test routine
recommended polling time:     (   2) minutes.
Extended self-test routine
recommended polling time:     (1482) minutes.
SCT capabilities:           (0x003d)   SCT Status supported.
               SCT Error Recovery Control supported.
               SCT Feature Control supported.
               SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   050    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   100   100   050    Pre-fail  Offline      -       0
  3 Spin_Up_Time            0x0027   100   100   001    Pre-fail  Always       -       2842
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       30
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   050    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   100   100   050    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       151
 10 Spin_Retry_Count        0x0033   100   100   030    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       30
 23 Unknown_Attribute       0x0023   100   100   075    Pre-fail  Always       -       0
 24 Unknown_Attribute       0x0023   100   100   075    Pre-fail  Always       -       0
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       18
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       34
194 Temperature_Celsius     0x0022   100   100   000    Old_age   Always       -       37 (Min/Max 21/46)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
220 Disk_Shift              0x0002   100   100   000    Old_age   Always       -       524289
222 Loaded_Hours            0x0032   100   100   000    Old_age   Always       -       147
223 Load_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
224 Load_Friction           0x0022   100   100   000    Old_age   Always       -       0
226 Load-in_Time            0x0026   100   100   000    Old_age   Always       -       529
240 Head_Flying_Hours       0x0001   100   100   001    Pre-fail  Offline      -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
« Последна редакция: Dec 27, 2023, 22:28 от ivanovslavy »
Активен

remotexx

  • Напреднали
  • *****
  • Публикации: 3244
    • Профил
Re: Проблем с HDD след спиране на сървъра
« Отговор #29 -: Dec 27, 2023, 22:20 »
Аз пак да повторя БИОСа е направен при активен Quick Start да не открива някой неща ...веднага (хеле па с гоуем Spin Up Time) така и така ОС като зареди ще си подкачи драйвера и БИОС-а да го духа  ;D

нали се сещаш че ако е (само) от кабела то и при рестарт ще го прави, а ти твърдиш че всеки рестарт е успешен (при подгрял и развъртян диск - след неуспешен студен старт, който обаче му е дал време да се инициализира и развърти)

отделно че (аз) не мисля че трябва да го проверява за грешки всеки път (не ССД диск) а веднъж месечно, което ме навежда на мисълта за "мръсно-то изключване", а и как така кабела прекъсва само по време на зарежадне а не и при работа...


П.П. Така като гледам САТА-0 кабела ти е здрав, нали не ти е  правило проблеми ССД-то смени ги за пробата САТА-0 и САТА-3 и дай да видим и САТА-0 дали ще ти се губи из БИОС-а

--
Предполагам че проблемния диск е uuid 9d5d28... (понеже другите 2 изскачат точно след съобщения за откриването на SSD/NVMe съответно) и точно тоя 9d5d28... чака нещо да приключи а то не сколасва (овреме)

A start job is runnig for /dev/disk/by-uuid/9d5d28... (1m 1s / 1m 30s)

като това си е винаги там и след 2те снимки на БИОС-а (видим/невидим) което значи че БИОС-а видял не видял ОС-а винаги го е видял, но не знам какво чака (и не дочаква) ...предполагам мръсно изключване(и да си дозапише журнала да го копира върху истинския диск а SMR/TDMR писането е бавно). Както казах ОС драйвърите вече не разчитат на БИОС, те сами си откриват/инициализират/подкарват хардуера - БИОС е вече само за събуждане на комп-а и инит на хардуер нужен за началното зареждане (а тоя предполагам не ти е буутващ диск) а оттам вече си го поема ОС драйвъра (никой не печата по екрана/пише във видео паметта през БИОС-а в днешно време)

--
тъй като гледам от теста, почти всички други го бият (изкл. при последователен запис), даже и дърти баракуди, чак и WD да те бие ..това си е постижение
https://www.kitguru.net/components/hard-drives/simon-crisp/toshiba-mg08-mg08aca16te-16tb-hdd-review/

https://www.kitguru.net/wp-content/uploads/2020/04/CrystalDiskMark-4K-QD32-Compared.png
https://www.kitguru.net/wp-content/uploads/2020/04/Workloads.png
https://www.kitguru.net/wp-content/uploads/2020/04/IOMeter-4K-Random-Read_Write-Compared.png
« Последна редакция: Dec 27, 2023, 22:55 от remotexx »
Активен