Linux за българи: Форуми

Хардуер за Линукс => Сървъри => Темата е започната от: linadmirer в Apr 06, 2010, 12:09



Титла: Проблем със софтуерен RAID 5
Публикувано от: linadmirer в Apr 06, 2010, 12:09
Здравейте, приятели!
След дълго четене на разни статии в интернет стигнах до извода, че сам няма да се справя с този проблем. Моля Ви за помощ!
Имам уеб сървър Дебиан с файлова система reiserfs, който е инсталиран върху райд5 масив от 3 диска ( х 750 GB). Райда, както и сървърът като цяло са ми завещани. Знам, че е софтуерен, разбрах и че има един малък партишън от 1ГБ, който е в Райд1 и на който е записан буутлодер-а. Преди няколко дена мой приятел и колега разбрал, че няма връзка със сървъра и закачил монитор. Съобщението показвало грешка във файловата система. Той направил студен рестарт, след което в момента не намира " / " и казва, че не може да зареди масива /dev/md0 поради липса на достатъчно ус-ва (2/3). Има важна информация на този масив. В биос трите диска се виждат нормално. Стигнах до извода, че софтуерният райд е развален. Как да го ребилдна без да загубя информация?
Държа да отбележа, че мода да стартирам live CD от флаш памет. Това ми е единственият вариант.


Титла: Re: Проблем със софтуерен RAID 5
Публикувано от: foxb в Apr 06, 2010, 13:34
А провери ли дисковете за грешки?

Ако не може да на мери 2 от 3 диска значи информацията е загубена...

http://tldp.org/HOWTO/Software-RAID-0.4x-HOWTO-4.html


Титла: Re: Проблем със софтуерен RAID 5
Публикувано от: laskov в Apr 06, 2010, 13:39
Възможно е малкият партишън да е бил / . Възможно е поради проблем в четенето на малкия партишън да не може да се активира и монтира райда. Не е задължително райдът да е развален и да се нуждае от ребилд. Зареди от live CD. Аз бих ползвал http://www.sysresccd.org/Main_Page ($2). Хвърли един поглед на някое ръководство за райд, напр.  това ($2). Като стигнеш донякъде питай пак. :)

//Надявах се някой по-сведущ да отговори преди мен. Вече няма да правя така. Не е добре, че в разделите в дъното на форума има повече активност, но ...

Започни с едно fdisk -l и покажи резултата тук.


Титла: Re: Проблем със софтуерен RAID 5
Публикувано от: neter в Apr 06, 2010, 14:04
От LiveCD-то пусни една проверка на дисковете с fsck, след което, ако всичко е добре, от самото LiveCD направи raid 5 масив от 3-те диска, за да синхронизираш информацията между тях. След което рестартирай системата и току виж тръгнало без проблем. Ако не тръгне, зареди отново LiveCD-то и направи пак масива от там, след което се chroot-ни в него, за да огледаш за проблеми (логове, конфигурация на mdadm...). Направи тези неща, пък да видим какво ще стане след това.


Титла: Re: Проблем със софтуерен RAID 5
Публикувано от: linadmirer в May 04, 2010, 10:20
при направата на raid 5 трябва ли да съобразявам по някакъв начин предварителната подредба на дисковете? т.е. Въпросите ми са два
1. fsck пускам на всеки един от хардовете (3) по отделно?
2. ако следвам това ръководство стъпка по стъпка ще изгубя информацията.
Може ли да ми кажете как точно да създам raid5 от live cd-то?
Съжалявам много, но съм адски бос относно raid5-ца....
Моля ви за помощ


Титла: Re: Проблем със софтуерен RAID 5
Публикувано от: tolostoi в May 04, 2010, 11:07
Би могъл да заредиш лайвцд с Убунту 10.4, има един туул за дискове и райд масиви, който вероятно би ти показал проблема.

Ето как изглежда
http://img693.imageshack.us/img693/3550/screenshot80gbatast9882.png ($2)



Титла: Re: Проблем със софтуерен RAID 5
Публикувано от: linadmirer в May 13, 2010, 09:46
От LiveCD-то пусни една проверка на дисковете с fsck, след което, ако всичко е добре, от самото LiveCD направи raid 5 масив от 3-те диска, за да синхронизираш информацията между тях. След което рестартирай системата и току виж тръгнало без проблем. Ако не тръгне, зареди отново LiveCD-то и направи пак масива от там, след което се chroot-ни в него, за да огледаш за проблеми (логове, конфигурация на mdadm...). Направи тези неща, пък да видим какво ще стане след това.

относно това, вижте какво прочетох :

Цитат
Q: I have a RAID-4 or a RAID-5 (parity) setup, and lost power while there was disk activity. Now what do I do?

    A: The redundancy of RAID levels is designed to protect against a disk failure, not against a power failure. Since the disks in a RAID-4 or RAID-5 array do not contain a file system that fsck can read, there are fewer repair options. You cannot use fsck to do preliminary checking and/or repair; you must use ckraid first.

    The ckraid command can be safely run without the --fix option to verify the inactive RAID array without making any changes. When you are comfortable with the proposed changes, supply the --fix option.

    If you wish, you can try designating one of the disks as a ''failed disk''. Do this with the --suggest-failed-disk-mask flag.

    Only one bit should be set in the flag: RAID-5 cannot recover two failed disks. The mask is a binary bit mask: thus:

        0x1 == first disk
        0x2 == second disk
        0x4 == third disk
        0x8 == fourth disk, etc.
               

    Alternately, you can choose to modify the parity sectors, by using the --suggest-fix-parity flag. This will recompute the parity from the other sectors.

    The flags --suggest-failed-dsk-mask and --suggest-fix-parity can be safely used for verification. No changes are made if the --fix flag is not specified. Thus, you can experiment with different possible repair schemes

да речем дисковете са :
/dev/sda1
/dev/sdb1
/dev/sdc1

според твоя съвет трябва да пусна
# fsck /dev/sda1
# fsck /dev/sdb1
# fsck /dev/sdc1

Така ли? Ако е така няма ли да се скапе нещо?


Титла: Re: Проблем със софтуерен RAID 5
Публикувано от: linadmirer в May 18, 2010, 11:45
Би могъл да заредиш лайвцд с Убунту 10.4, има един туул за дискове и райд масиви, който вероятно би ти показал проблема.

Ето как изглежда
http://img693.imageshack.us/img693/3550/screenshot80gbatast9882.png ($2)

Пуснах live cd, при което от това туулче се вижда, че хардовете са наред. именувани са така:
/dev/sda1
/dev/sdb1
/dev/sdc1
Заделени са на sda1 и sdc1 по 1 GB, който е райд 1. Останалата част от тези два диска го дава като "raid partition"
на sdb1  в началото се вижда  голяма порция място, което трябва да е за райд5. В края на диска се виждат два партишъна малки.
при цъкване на "start array" казва, че не може да стартира поради недостатъчност на параметри.
другото което е, при нормално стартиране на машината казва "cannot find /dev/mapper/raid_name"
Пробвах да маунтна само /dev/sdb1 да го разгледам, при което такава директория mapper въобще няма.......
някакви идеи ?


Титла: Re: Проблем със софтуерен RAID 5
Публикувано от: laskov в May 18, 2010, 12:02
някакви идеи ?
Ядрото ти е компилирано без вградена поддръжка на райд.


Титла: Re: Проблем със софтуерен RAID 5
Публикувано от: linadmirer в May 18, 2010, 12:10
някакви идеи ?
Ядрото ти е компилирано без вградена поддръжка на райд.
как мога да върна старото или евентуално да оправя тая каша?


Титла: Re: Проблем със софтуерен RAID 5
Публикувано от: laskov в May 18, 2010, 12:54
Хайде някой дебианец да помага :) !
BTW Не търси директория /dev на дисковете. Тя, както и директорията /proc съществуват във файловата система, но не и на диска. Създават се от ядрото по време на стартирането.


Титла: Re: Проблем със софтуерен RAID 5
Публикувано от: plamen_f в May 18, 2010, 16:18
нещо се загубих тук. След като имаш РАИД1 който предполагаш, че е от sda1 и sdc1 и пак предполагаме, че е /, тогава ако и да е разбутан този раид би трябвало поне един от двата диска да бутва. Ако бутнеш от него какво ти казва
cat /prom/mdstat

Абе въобще я от едно лайв CD монтирай трите диска и дай изхода от
sudo fdisk -l


Титла: Re: Проблем със софтуерен RAID 5
Публикувано от: linadmirer в May 18, 2010, 16:29
нещо се загубих тук. След като имаш РАИД1 който предполагаш, че е от sda1 и sdc1 и пак предполагаме, че е /, тогава ако и да е разбутан този раид би трябвало поне един от двата диска да бутва. Ако бутнеш от него какво ти казва
cat /prom/mdstat

Абе въобще я от едно лайв CD монтирай трите диска и дай изхода от
sudo fdisk -l
не ми позволява да маунтна sda1 и sdc1 ....


Титла: Re: Проблем със софтуерен RAID 5
Публикувано от: plamen_f в May 18, 2010, 16:48
мда ако са fd тип няма как да ги монтираш. Обаче:

Цитат
Заделени са на sda1 и sdc1 по 1 GB, който е райд 1. Останалата част от тези два диска го дава като "raid partition"

sda1 ли е 1 GB или на него имаш волуме който е 1 ГБ? Нещо не ми се вържат нещата. Ако искаш да ти се помогне дай повече инфо. Като не можеш ги монтира поне от лайв цд на убунту пусни gparted и дай структурата на 3-те диска тука ако трябва на картинки. Да не гадаем като бивши магьосници :D

БТВ. само проблеми като твоя ме държат лично мен в този форум - от тях и аз уча нещо полезно.


Титла: Re: Проблем със софтуерен RAID 5
Публикувано от: laskov в May 18, 2010, 16:55
Искам да попитам ползващите Дебиан:
1. Може ли дебиан да се ъпдейтне автоматично, но така, че да си ъпдейтне и ядрото. И ако да,
2. може ли новото ядро да е компилирано без вградена поддръжка на райд и ако да,
3. как може да му се каже да зарежда старото ядро и
4. къде може да се види лог на ъпдейтите - на коя дата кое е ъпдейтнато ?


Титла: Re: Проблем със софтуерен RAID 5
Публикувано от: tolostoi в May 18, 2010, 17:13
Не може автоматично, освен ако някой не си е написал скрипт за това.
Не ми се вярва ако е стандартно ядро да няма поддръжка. По-скоро е друга играта в дебиан, поддръжката на Linux MD arrays (май това се ползва тук) се предоставя от пакета mdadm http://packages.debian.org/lenny/mdadm ($2) Другият евентуален вариант (ако има някакво желязо за raid в машината, пък бил той и софтуерен такъв) е да работи с dmaraid http://packages.debian.org/lenny/dmraid ($2) (което си е пакет от драйвери, за така наречените фейк райд платки) За да работят трябва да бъде инсталиран съответният пакет, при инсталацията dpkg променя vmlinuz-а и добавя поддръжката на раид-а. Става активна след рестарт и буутване от промененият вече vmlinuz. В този ред на мисли е възможно при някой от ъпдейтите да е премахнат пакета mdadm (но не може да стане автоматично това) и след рестарт да е увиснала машината, струва ми се много малко вероятно след като и Убунту не е искало да монтира раид-а. За лог ... не се сещам, предполгам дпкг.лог-а Ето при мен какво показва. 
Код:
cat /var/log/dpkg.log...
2010-05-07 22:53:25 status unpacked clamav-freshclam 0.96+dfsg-4~volatile1
2010-05-07 22:53:25 status unpacked clamav-freshclam 0.96+dfsg-4~volatile1
2010-05-07 22:53:25 status unpacked clamav-freshclam 0.96+dfsg-4~volatile1
2010-05-07 22:53:25 status half-configured clamav-freshclam 0.96+dfsg-4~volatile1
2010-05-07 22:53:28 status installed clamav-freshclam 0.96+dfsg-4~volatile1
2010-05-07 22:53:28 configure clamav-daemon 0.96+dfsg-4~volatile1 0.96+dfsg-4~volatile1
2010-05-07 22:53:28 status unpacked clamav-daemon 0.96+dfsg-4~volatile1
2010-05-07 22:53:28 status unpacked clamav-daemon 0.96+dfsg-4~volatile1
2010-05-07 22:53:28 status unpacked clamav-daemon 0.96+dfsg-4~volatile1
2010-05-07 22:53:28 status unpacked clamav-daemon 0.96+dfsg-4~volatile1
2010-05-07 22:53:28 status half-configured clamav-daemon 0.96+dfsg-4~volatile1
2010-05-07 22:54:09 status installed clamav-daemon 0.96+dfsg-4~volatile1
2010-05-07 22:54:09 configure clamav 0.96+dfsg-4~volatile1 0.96+dfsg-4~volatile1
2010-05-07 22:54:09 status unpacked clamav 0.96+dfsg-4~volatile1
2010-05-07 22:54:09 status half-configured clamav 0.96+dfsg-4~volatile1
2010-05-07 22:54:09 status installed clamav 0.96+dfsg-4~volatile1
Едит: Старо ядро се зарежда тривиално, като избереш от груб по-старото ядро.


Титла: Re: Проблем със софтуерен RAID 5
Публикувано от: laskov в May 18, 2010, 17:20
Опитвам се да му подскажа да прегледа логовете за ъпдейтите преди датата Х, но не знам какво да гледа.
И на мен не ми се вярва да няма поддръжка на софт райд, но ми се вижда напълно нормално да няма поддръжка на reiserfs.
Ясно че от груб, но аз ползвам лило и не знам какво да му кажа за конфиг на груб, нито пък къде да провери за стари ядра.


Титла: Re: Проблем със софтуерен RAID 5
Публикувано от: tolostoi в May 18, 2010, 17:27
Той ако не може да си монтира масива, няма как да види логовете, ако успее от лаивцд, да монтира и да chroot-не да погледне какво има и какво не инсталирано и т. н. Но и раид 5 не съм ползвал, ползвам съм само раид1 и то на хардуерно ниво, не съм се занимавал с мдадм.


Титла: Re: Проблем със софтуерен RAID 5
Публикувано от: plamen_f в May 18, 2010, 17:30
Хм ето как някои си решават проблема с ъпдейта (аз ползвам Убунту и не съм фен на всички автоматики):

Цитат
Debian Lenny comes with unattended-upgrades, which originated from Ubuntu and is considered to be the defacto solution for unattended upgrades for Debian starting from Lenny/5.0.
To get it up and running on a Debian system you need to install the unattended-upgrades package.

Then add these lines to /etc/apt/apt.conf:

APT::Periodic::Update-Package-Lists "1";
APT::Periodic::Unattended-Upgrade "1";

A cron job is then run nightly and checks if there are security updates which need to be installed.

Actions by unattended-upgrades can be monitored in /var/log/unattended-upgrades/. Be wary, that for kernel security fixes to become active, you need to reboot the server manually. This can also be done automatically in course of a planned (e.g. monthly) maintenance window.

За мен е доста странно да се прецака груб-а и на двата диска, така че все от единия трябва да се види нещо. Но нека все пак първо даде структурата щото все още поне на мен не ми е ясно какво прави.

Друг е проблема ако има груб само на единият диск (честа грешка при конфигуриране на софтуерен раид). БТВ при 8.04 например кода по подразбиране на initramfs е бъгав и не открива счупен диск при зареждане - има си пач де, но дали при дебиан е така - нека каже друг.


Титла: Re: Проблем със софтуерен RAID 5
Публикувано от: laskov в May 18, 2010, 17:34
Той груба не му е повреден, предполагам, че си зарежда, но не може да монтира / или поради липса на поддръжка на райд, или на reiserfs.


Титла: Re: Проблем със софтуерен RAID 5
Публикувано от: zeridon в May 20, 2010, 20:37
Би могъл да заредиш лайвцд с Убунту 10.4, има един туул за дискове и райд масиви, който вероятно би ти показал проблема.

Ето как изглежда
http://img693.imageshack.us/img693/3550/screenshot80gbatast9882.png ($2)

Пуснах live cd, при което от това туулче се вижда, че хардовете са наред. именувани са така:
/dev/sda1
/dev/sdb1
/dev/sdc1
Заделени са на sda1 и sdc1 по 1 GB, който е райд 1. Останалата част от тези два диска го дава като "raid partition"
на sdb1  в началото се вижда  голяма порция място, което трябва да е за райд5. В края на диска се виждат два партишъна малки.
при цъкване на "start array" казва, че не може да стартира поради недостатъчност на параметри.
другото което е, при нормално стартиране на машината казва "cannot find /dev/mapper/raid_name"
Пробвах да маунтна само /dev/sdb1 да го разгледам, при което такава директория mapper въобще няма.......
някакви идеи ?
Включвам се малко късно но нищо.

От това което си написал си вадя извода че имаш 3 диска сцепени на по 1GB + остатък (и някакви дребни партиции)

1ГБ парчетата са в райд1 и там ти е /boot директорията
Големите парчета най вероятно са лвм (/dev/mapper/....)

Ако обичаш дай fdisk -l /dev/sda от тук ще можем да кажем какви партиции има точно и като какво са конфигурирани (малките най-вероятно са служебни и не те интересуват)

Като опит за спасяване пусни SystemRescue CD или GRML или нещо което е правено за спасяване на данни

Като запали някакво такова цд (което да има поддръжка на LVM пусни
Код
GeSHi (Bash):
  1. pvscan
  2. pvs
  3. lvmdiskscan
  4. lvscan -abvPd
  5. vgscan
и дай изхода.

Ако имаш валиден lvm масив най-вероятно ще бъде асемблиран след lvmscan-a и ще можеш да го монтираш и да си откопаш данните

интересни команди които може да помогнат: vgscan, lvscan, pvscan,