Google przeprowadził bardzo dokładne badanie awarii dysków twardych, które wykazało, że znaczna część dysków twardych uległa awarii w ciągu pierwszych 3 miesięcy intensywnego użytkowania.
Razem z moimi współpracownikami myślimy, że moglibyśmy wdrożyć proces wypalania wszystkich naszych nowych dysków twardych, który mógłby potencjalnie zaoszczędzić nam bólu serca przed stratą czasu na nowych, niesprawdzonych dyskach. Ale zanim wdrożymy proces docierania, chcielibyśmy uzyskać wgląd od innych, którzy są bardziej doświadczeni:
- Jak ważne jest nagrywanie na dysku twardym przed rozpoczęciem korzystania z niego?
- Jak wdrożyć proces wypalania?
- Jak długo palisz się na dysku twardym?
- Jakiego oprogramowania używasz do nagrywania dysków?
- Ile stresu jest za dużo dla procesu wypalania?
EDYCJA: Ze względu na charakter działalności RAID-y nie mogą być używane przez większość czasu. Musimy polegać na pojedynczych dyskach, które są często wysyłane pocztą w całym kraju. Tworzymy kopie zapasowe dysków tak szybko, jak to możliwe, ale wciąż napotykamy awarię tu i tam, zanim otrzymamy możliwość wykonania kopii zapasowej danych.
AKTUALIZACJA
Moja firma już od jakiegoś czasu wdrożyła proces wypalania i okazała się niezwykle przydatna. Natychmiast wypalamy wszystkie nowe dyski, które mamy w magazynie, co pozwala nam znaleźć wiele błędów przed wygaśnięciem gwarancji i przed zainstalowaniem ich w nowych systemach komputerowych. Przydatne okazało się również sprawdzenie, czy dysk się zepsuł. Gdy jeden z naszych komputerów zacznie napotykać błędy, a dysk twardy jest głównym podejrzanym, ponownie uruchomimy proces wypalania na tym dysku i sprawdzimy wszelkie błędy, aby upewnić się, że dysk rzeczywiście był problemem przed rozpoczęciem procesu RMA lub rzucaniem to w koszu.
Nasz proces wypalania jest prosty. Mamy wyznaczony system Ubuntu z dużą ilością portów SATA i uruchamiamy badblocks w trybie odczytu / zapisu z 4 przebiegami na każdym dysku. Aby uprościć sprawę, napisaliśmy skrypt, który wyświetla ostrzeżenie „DANE ZOSTANĄ USUNIĘTE ZE WSZYSTKICH DYSKÓW”, a następnie uruchamia błędne bloki na każdym dysku oprócz dysku systemowego.