W weekend otrzymałem kilka e-maili z naszego sieciowego serwera pamięci (tylko niestandardowe pudełko z oprogramowaniem RAID 1 dla dysków CentOS 5 i 2 2 TB), wskazujące na SMART wykryte problemy z jednym z dysków.
Zrobiłem status i 2 z nalotowanych partycji zostały oznaczone jako nieudane:
[root@aapsan01 ~]# cat /proc/mdstat
Personalities : [raid1]
md1 : active raid1 sdb1[1] sda1[0]
104320 blocks [2/2] [UU]
md0 : active raid1 sdb3[1] sda3[2](F)
4064320 blocks [2/1] [_U]
md3 : active raid1 sdb5[1] sda5[0]
1928860160 blocks [2/2] [UU]
md2 : active raid1 sdb2[1] sda2[2](F)
20482752 blocks [2/1] [_U]
Tak więc ustawiłem wszystkie partycje sda na „nie powiodło się”, pomyślnie usunąłem wszystkie lustra sda, włożyłem nowy identyczny dysk 2 TB (po wyłączeniu) i uruchomiłem. Teraz nie mogę się zalogować, ponieważ komunikaty o błędach powtarzają się po osiągnięciu tablicy rd md: autodetect podczas procesu rozruchu. Początkowo błędy wyglądały jak:
DRDY err (UNC) -- exception emask media error
Teraz dostaję błędy we / wy. Próbowałem z uszkodzonym dyskiem usuniętym, a następnie z nim ponownie. Ten sam program. Zapisy, które znalazłem, pokazują, że jest to prosty proces odzyskiwania. Co daje? Czy ktoś napotkał coś podobnego? Wygląda na to, że proces rozruchu nadal trwa, choć przejście przez każdy etap zajmuje eony. Czy ktoś kiedykolwiek musiał czekać tak długo, aby dotrzeć do monitu? Mam nadzieję, że jeśli nie uda mi się dostać do monitu, mogę dostać się gdzieś z płytą ratunkową.