Титла: CentOS release 6.4 и софтуерен RAID 1 Публикувано от: mrowcp в Oct 02, 2015, 22:45 Здравейте,
Имам два харда в raid1, но единия то тях си замина. Взех нов, но в бързането зарбавих да маркирам стария като фейлнал и да го махна от контейнера . Не знам дали това е от значение, но така е по ръководствата (примерно тук ($2)) След доста ръчкане и тестване, уж билдването започна. При проверка с cat /proc/mdstat си излизаха процентите. Няколко часа по-късно, положението е следното: Код
Аз ли неправя нещо както трябва или... Предполагам не би трябвало да иска рестарт за да се "разпознае" райда? Титла: Re: CentOS release 6.4 и софтуерен RAID 1 Публикувано от: mrowcp в Oct 05, 2015, 15:09 Приемам всякакви предложения и помощ, които включват запазване на информацяита на sda :D
Титла: Re: CentOS release 6.4 и софтуерен RAID 1 Публикувано от: k0tka в Oct 05, 2015, 16:00 Можеш ли да дадеш информация от:
Код: mdadm -Q -D /dev/md0 По спомен, мисля че това което виждам е така наречения split brain. Edit: Прегледай този скрипт: https://github.com/dobber/md-split Титла: Re: CentOS release 6.4 и софтуерен RAID 1 Публикувано от: mrowcp в Oct 05, 2015, 17:42 Можеш ли да дадеш информация от: Да, разбира се: Код
Ето ти: Код
Ами аз имам уж само един контейнер - md0. Не би трябвало проблема ми да е като този от скрипта. Титла: Re: CentOS release 6.4 и софтуерен RAID 1 Публикувано от: k0tka в Oct 05, 2015, 19:03 Можеш ли да постнеш и mdadm.conf-а?
Извинявай но гадая малко....трябва да имаш само md0 и ако схващам правилно sdb се е счупил и след смяната му sda е активен в md127 а двата sda и sdb са маркирани като Spare (S) в md0... Намерих някаква старичка тема ($2), която ми се приближава до твоя случай, но както казвам...гадая и съм объркан.....и съм виждал как се синква изпаднал диск за 5 дни от масив (raid1) върху активния в масива на production система . Не искам да те подвеждам с предположения. Титла: Re: CentOS release 6.4 и софтуерен RAID 1 Публикувано от: mrowcp в Oct 05, 2015, 19:13 Можеш ли да постнеш и mdadm.conf-а? Първо мерси за помоща. Както казах, няма проблем за всякакви догадки и предположение, защото ме измъчи тоя райд. Така като чета изглежда точно както го описваш. Ето конфига: Код
Код
Ако правилно съм разбрал от линка, редактирам mdadm.conf, като оставям само md0 и стартирам update-initramfs -u Титла: Re: CentOS release 6.4 и софтуерен RAID 1 Публикувано от: k0tka в Oct 06, 2015, 11:21 Доколкото виждам разположението на mdadm.conf и "# mdadm.conf written out by anaconda" ти не ползваш Debian/ubuntu, следователно update-initramfs -u е dracut -f което ще презапише текущия но преди това направи копие на /boot/initramfs-$(uname -r).img.
Проблема е че в момента активния раид е md127. Хубаво е да погледнеш и UUID-то (blkid) с това в /etc/fstab. Предполагам че новия диск си го hot plug-нал и това което бих направил (след задължителен бекъп) е следното. Махам новия диск виждаме какво се случва с раидовете, евентуален reboot в който бих очаквал машината да boot-не с degraded раид (както е било когато се е счупил диска) след което стандартната процедура с фейлване на диска махане от масива и добавяне на новият диск. Въпроса е че ще трябва да си поиграеш и рискуваш. С новият initrd/initramfs това което ще се случи е да ъпдейтнеш конфигурацията на /etc/mdadm.conf в самият initrd, но тва трябва да се случи след като сме сигурни че масивът е правилно намерен и конфигурирани, дори и деградирал а в твоят случай не изглежда така, защото ти трябва да имаш един, а реално машината вижда 2. Аз бих постъпил по този начин за да опитам да получа старата ситуация с md0 и един диск. Въпроса е че ако машината не буут-не след рестарт ще се наложи в single user mode да опитваш да assemble-ваш раида с единия диск и вероятно тогава да update-неш initrd за да буутнеш с дегрейдед раид. Но всичко това са предположения. Както казваше бивш колега: "Трябва да счупиш няколко раида, за да се научиш да ги оправяш" Успех! Титла: Re: CentOS release 6.4 и софтуерен RAID 1 Публикувано от: mrowcp в Oct 06, 2015, 11:38 Доколкото виждам разположението на mdadm.conf и "# mdadm.conf written out by anaconda" ти не ползваш Debian/ubuntu, следователно update-initramfs -u е dracut -f което ще презапише текущия но преди това направи копие на /boot/initramfs-$(uname -r).img. Мерси за напътствията. Ето малко повече инфо от ръчкането от преди дни. След като махнах проблемния хард, опитах да го маркирам фейл с: Код: mdadm --manage /dev/md0 --fail /dev/sdb* , но аз така или иначе вече го бях свалил и просто sdb не съществуваше и ми даваше грешна команда. След доооста четене и пробване на кажи-речи какво ли не, след като уж RAID-а тръгна да се билдва и нищо не стана след зареждането в /proc/mdstat , реших да рестартирам машината. По закона на Мърфи, тя не буутна и даде грешка във файловата система. След няколко fsck-а в сингъл мод, уж се оправи, но аз разкачих 2рия диск, защото си мислех да не би нещо от него да идва проблема след билдването на райда. Разкачих и 2ри хард за тест, машината тръгна. После я спрях и пак закачих харда. Сега ще погледна тези неща които си казал. Титла: Re: CentOS release 6.4 и софтуерен RAID 1 Публикувано от: k0tka в Oct 06, 2015, 11:43 Значи че / ти е md0...не е просто /home примерно?
Ако успееш да подкараш машината с здравия диск дори и дегрейдед ще започнеш от началото на процедурата. Пиши какво се случва. Титла: Re: CentOS release 6.4 и софтуерен RAID 1 Публикувано от: mrowcp в Oct 06, 2015, 12:03 Значи че / ти е md0...не е просто /home примерно? Всъщност е md127* Код
Титла: Re: CentOS release 6.4 и софтуерен RAID 1 Публикувано от: k0tka в Oct 06, 2015, 13:41 Значи същата работа. Имал си мд0 но сега имаш мд127, а мд0 е грешен.
Опитай да махнеш новия диск и виж дали ще запали с мд127 или с мд0 с един дегрейдет диск. Според мдадм мд0 е с два spare диска /dev/sda и /dev/sdb което е грешно. Опитай се да върнеш старото положение. Махай новия диск и ребутвай само със стария. Надявам се да можеш да си направиш бекъп на важните неща в случай че нещо се сбози. В случай че запали постни пак изхода от командите които ти поисках. Можеш и изхода от mdadm --examine --scan да сравниш с това което е в mdadm.conf. Не забравяй че dracut -f може да ти бъде от полза за да генерираш правилният инитрамфс имидж. И не забравяй за копие на стария инитрамфс Титла: Re: CentOS release 6.4 и софтуерен RAID 1 Публикувано от: mrowcp в Oct 08, 2015, 08:47 Значи същата работа. Имал си мд0 но сега имаш мд127, а мд0 е грешен. За момента направих копие на initramfs и разкачих 2рия диск. Ето резултата от командите: Код
Не знам дали ми се струва или има разлика между mdadm.conf и детайл скана. Еднаквото UUID ме обърка тотално :) Титла: Re: CentOS release 6.4 и софтуерен RAID 1 Публикувано от: k0tka в Oct 08, 2015, 16:04 Дай изхода от df -h и cat /proc/mdadm и blkid
Намерих няколко извадки с подобни проблеми които могат да ти бъдат полезни: https://bugs.launchpad.net/ubuntu/+source/mdadm/+bug/964052 https://bugzilla.redhat.com/show_bug.cgi?id=606481 Това което мисля че трябва да направиш е описано тук: https://aubreykloppers.wordpress.com/2012/07/06/mdadm-devmd127/ Или с други думи редактираш mdadm.conf с правилния раид (/dev/md0 с UUID 392de428:b7cb9135:70102f5b:d9e480b4) след като направиш копие на файла и генерираш нов инитрамфс. Интересно е дали ще сработи ако генерираш нов инитрамфс без да пипаш mdadm.conf но нищо не ти пречи да пробваш и по двата начина - вече имаш копия и на конфигурационния файл и на инитрамфс. Дай изхода от командите за сравнение и действай, не виждам друг начин. Междудругото имал ли си някакви ъпдейти/ъпгрейди по време на проблема, които могат да генерират нов инитрамфс, като ъпдейт на кърнел например? Титла: Re: CentOS release 6.4 и софтуерен RAID 1 Публикувано от: mrowcp в Oct 09, 2015, 10:34 Дай изхода от df -h и cat /proc/mdadm и blkid Код
Не мога да намеря cat /proc/mdadm. Имам само .conf-а и bin-а на mdadm. Код
Не, не са правени никакви ъпдейти/ъпгрейди. Просто един ден намерих харда с умряла механика. Титла: Re: CentOS release 6.4 и софтуерен RAID 1 Публикувано от: k0tka в Oct 09, 2015, 13:12 да нормално е да не го намериш :) /proc/mdstat е това което исках да видя.
Титла: Re: CentOS release 6.4 и софтуерен RAID 1 Публикувано от: mrowcp в Oct 09, 2015, 13:33 да нормално е да не го намериш :) /proc/mdstat е това което исках да видя. Код
Титла: Re: CentOS release 6.4 и софтуерен RAID 1 Публикувано от: k0tka в Oct 09, 2015, 15:08 Пълна каша. Действай с новия инитрамфс, ребутвай и да видим какво ще стане. Ако нищо не сработи модифицирай mdadm.conf и генерирай нов инитрамфс както съм писал преди 3 коментара. Не виждам какво друго можеш да направиш за да ти остане само един райд било то и мд127.
Титла: Re: CentOS release 6.4 и софтуерен RAID 1 Публикувано от: mrowcp в Oct 18, 2015, 20:22 Пълна каша. Действай с новия инитрамфс, ребутвай и да видим какво ще стане. Ако нищо не сработи модифицирай mdadm.conf и генерирай нов инитрамфс както съм писал преди 3 коментара. Не виждам какво друго можеш да направиш за да ти остане само един райд било то и мд127. Нищо не стана... Ъпдейта не прави нищо, има някакъв бъг ($2) Опитах да направя update-initramfs , но такава команда няма. Инсталирах къде какъв пакет имаше и пак нищо. Код
UID-а на md0 си е правилния. Добре, ако жертвам инфото, как да билдна наново всичко? И възможно ли е това да стане отдалечено (ssh)? Даже се чудя дали да не направя една чиста инсталация и без това тоя цент е супер стар вече... CentOS release 6.4 (Final) Титла: Re: CentOS release 6.4 и софтуерен RAID 1 Публикувано от: k0tka в Oct 19, 2015, 10:34 Здравей,
Не става ясно какво си направил и какво не е станало ;) Както и да е, ако си решил да почваш от начало и да жертваш всичко, поне си поиграй със счупения масив, спирай, пускай махай...дочупи го, ще ти е от ползва следващия път! Ако искаш да се мъчиш без чиста инсталация, просто спри и махни всички райдове. След което трябва да създадеш райда с 2та диска. Нещо подобно на това. ($2) Прочети и тази ($2) статия и по-специално sfdisk примера за да копираш partition table-а от здравия върху новия диск. Титла: Re: CentOS release 6.4 и софтуерен RAID 1 Публикувано от: mrowcp в Nov 14, 2015, 12:24 Здравей, Мерси за проявения интерес :) Давам веднага фийдбек-а (поне това, ако не друго :) ). Нищо не стана с опитите за ребилд. На няколко пъти тръгваше да ребилдва (зареждаше процентите) и после даваше, че масива е деградирал. След рестарт на машината, нещата се омазваха и искаше fsck за да тръгне. В крайна сметка преинсталирах към CentOS Linux release 7.1.1503 (Core), като самия setup на инсталция си разпозна коректно райда и си билдна всичко. После разкачих от райда, форматирах и добавих пак 2рия хард за да тествам дали ще се билдне сам. Всичко мина ОК. |