Имам си една машина, на която работи един сайт... Всичко си беше наред до вчера, когато изведнъж от нищото IO wait скочи до небето и сайта започна да бави страшно. Пробвах доста неща, но без резултат. Броя заявки не са се увеличили, трафика не се е увеличил. Това, което виждам е, че mysql държи постоянно 40-50% от процесора.

Първо помислих, че проблем с дисковете (2 в софтуерен раид1), защото в dmesg имаше следното инфо:
[ 4152.088019] ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
[ 4152.088079] ata2.00: cmd b0/d0:01:00:4f:c2/00:00:00:00:00/00 tag 0 pio 512 in
[ 4152.088080] res 40/00:00:00:4f:c2/00:00:00:00:00/00 Emask 0x4 (timeout)
[ 4152.088115] ata2.00: status: { DRDY }
[ 4152.088149] ata2: hard resetting link
[ 4153.234660] ata2: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 4153.260871] ata2.00: configured for UDMA/133
[ 4153.260871] ata2: EH complete
[ 4153.260871] sd 1:0:0:0: [sdb] 1953525168 512-byte hardware sectors (1000205 MB)
[ 4153.260871] sd 1:0:0:0: [sdb] Write Protect is off
[ 4153.260871] sd 1:0:0:0: [sdb] Mode Sense: 00 3a 00 00
[ 4153.288871] sd 1:0:0:0: [sdb] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
Извадих диска от масива, но това не помогна и резултатите останаха същите.
Помислих да не би да го притеснява await, затова монтирах файловите системи с noawait, но това също не даде никакъв ефект.
В slow-query.log файла има доста заявки, но това е нормално предвид бавната работа на дисковете...
Всякакви идеи биха били полезни

Предпочитам да събера максимално много идеи, защото машината е на другия край на града и искам като отида да пробвам всичко хардуерно, а софтуерните тестове мога да ги направя веднага и да върна резултатите...