Mam serwer Netware 3.12 z ery 1998 r., Który obsługuje wszystko w naszym kampusie: księgę główną, zakupy, płace, informacje o studentach, stopnie, ty to nazwij. Serwer ma kontroler RAID Adaptec z dwoma woluminami:
- RAID 1, 2 dyski SCSI 17 GB, Seagate ST318417W
- RAID 5, 3 dyski SCSI 4 GB, 2 Seagate ST34573W i 1 ST34572W.
Obecnie jesteśmy na wczesnym etapie projektu wymiany tego systemu, ale nie tylko przeskakujesz do nowego takiego systemu, więc muszę utrzymać ten serwer do co najmniej listopada 2011 r.
W tym tygodniu nie mieliśmy awarii jednego, ale dwóch dysków twardych. Na szczęście pochodzą one z różnych woluminów i na razie możemy nadal działać, ale biorąc pod uwagę bliski charakter tych awarii, mam poważne wątpliwości, że będę w stanie uniknąć katastrofalnej awarii z tego serwera do celu listopadowego, jak to jest bez przywrócenie nadmiarowości macierzy RAID - zajmie tylko jedną awarię dysku w dowolnym miejscu i jestem całkowicie wkurzony.
Mamy szczęście, że mamy dokładnie dopasowane „części zamienne” dla obu dysków, ale części zamienne są w nieznanym stanie. Próbowałem zamienić tylko je, ale kontroler RAID nie jest wystarczająco inteligentny, aby sobie z tym poradzić i sprawia, że nie można uruchomić systemu.
Jeśli chodzi o sam kontroler RAID, istnieje narzędzie, do którego mogę się dostać podczas testu POST za pomocą skrótu Ctrl-A, ale nie mogę wiele z tego zrobić. Aby faktycznie zarządzać woluminami, najpierw muszę uruchomić się na Netware. W tym momencie mogę użyć CI/O Array Management Software Version 2.0
informacji o woluminie. Podejrzewam, że normalnym sposobem zarządzania rzeczami jest uruchomienie ze specjalnej dyskietki z oprogramowaniem kontrolera, ale ta dyskietka już dawno zniknęła.
Przeglądając opcje w oprogramowaniu RAID, myślę, że jedynym obsługiwanym sposobem na zastąpienie dysku w istniejącym woluminie RAID jest fizyczne dodanie dysku, uruchomienie i skonfigurowanie go jako „zapasowego” dla woluminu, wymuszenie użycia woluminu zapasowy, aby zastąpić istniejący dysk awaryjny (i w tym momencie tylko zgaduję), aby dysk zapasowy stał się zapasowy, naprawić wolumin, usunąć zapasowy dysk z woluminu, a następnie zamknąć i usunąć dysk. Następnie zacznij od nowa dla drugiego uszkodzonego dysku. Wszystko to sprowadza się do wielu przestojów, zakładając, że mogę nawet sprawić, by działało i że moje części zamienne są dobre.
Jeśli chodzi o znalezienie niezawodnych części zamiennych, nie mam pojęcia, gdzie nawet zacząć szukać nowego dysku SCSI 4 GB, a nawet jakiego dokładnie systemu SCSI szukam, ponieważ przeszedł kilka różnych iteracji w czasie.
Inną opcją jest migracja tego na maszynę wirtualną (hyper-v), ale wszystkie poprzednie próby, które podjęliśmy w tym obszarze, nie zaszły bardzo daleko. Kiedy ta maszyna została zainstalowana, właśnie kończyłem szkołę średnią, a więc wymaga niższej wiedzy o oprogramowaniu sieciowym i systemie dos, niż kiedykolwiek opracowałem, lub jeśli o tym zapomniałem (nie jestem też doktorem ne).
Częścią mojego problemu jest to, że jest to serwer o wysokim zużyciu, a zdejmowanie go przez kilka dni, aby dowiedzieć się, co się wydarzy, nie będzie latać bardzo dobrze.
Jeśli chodzi o pytanie, szukam czegoś, co może być pomocne w tej sytuacji: zalecenie dotyczące miejsca, w którym można znaleźć dobre części zamienne z tej epoki, osobiste doświadczenie w naprawianiu woluminów RAID za pomocą podobnego kontrolera lub budowaniu hyper-vmm z stary serwer netware, linia na dyskietce z lepszym oprogramowaniem dla kontrolera RAID, zalecenie dobrego konsultanta Novell w Nebrasce, który byłby w stanie naprawić problemy, zupełnie inna opcja, której jeszcze nie rozważałem itp.
Aktualizacja: w
przypadku kopii zapasowych mamy dobre (ostatnio zweryfikowane przez przywracanie) tylko kopie danych - nic w przypadku oprogramowania, które faktycznie działa.
Aktualizacja 2:
Tylko raport postępu, który aktualnie mam działającą instalację Netware 3.12 w VMWare Virtual Server 2.0, głównie dzięki przewodnikowi, który znalazłem tutaj:
http://cerbulescubogdan.blogspot.com/2010/11/novell-netware-312 -on-vmware.html
Kolejne kroki to przygotowanie pustych woluminów netware, aby pasowały do dodatkowych woluminów na moim istniejącym serwerze, zrobienie zrzutu wszystkiego na dysku C: \ i woluminów netware na moim istniejącym serwerze i ustalenie na podstawie tych informacji, jakie moduły należy dodać do netware, instalowanie moich licencji (nadal mamy ten dysk, jeśli jest dobry) i przenoszenie danych.
Mam zgodę na wyłączenie serwera na tydzień po pierwszym roku (niestety nie wcześniej), więc oprócz tworzenia pustych woluminów, reszta pracy będzie musiała poczekać.
Ostatnia aktualizacja (5 stycznia 2011 r.):
W tym tygodniu udało mi się uzyskać części zamienne działające w obu macierzach RAID bez utraty danych. Oba są teraz wymienione przez sterownik jako „AWARIA TOLLERANTA” (tak!). Byłem także w stanie wykorzystać postępy od mojej ostatniej aktualizacji i mam teraz funkcjonalny „zapasowy” serwer w VMWare Server 2.0. Część zapasowa może działać i korzystać z naszego oprogramowania erp, ale nie mogę go uruchomić, ponieważ nie mogę (jeszcze) drukować z tego pudełka (i nie mam pojęcia, dlaczego). Mimo to ta maszyna wirtualna zrobi się szczypta, jeśli nie mam innego wyboru, a między nią a naprawionymi macierzami RAID czuję się dobrze, żyjąc w tej sytuacji, dopóki nie będę w stanie zablokować maszyny w listopadzie.
Epilog (16 stycznia 2012 r.):
Projekt zastąpienia tego serwera nowym systemem został zrealizowany zgodnie z planem. Hurra, aby nie więcej oprogramowania sieciowego! Cały grad Sql Server! Król nie żyje. Niech żyje król!
Nadal planujemy utrzymać stary serwer jeszcze przez jakiś czas, aż do zakończenia audytu po roku podatkowym w sierpniu. Ale jeśli do tego czasu dojdzie do niepowodzenia, nikt nie będzie narzekał za bardzo.