Szukałem MTTF, MTBF, MTBR i MTBF dla naszych serwerów HP Gen9 działających w naszym środowisku produkcyjnym.
Korzeń mojego pytania powinien być zmartwiony czy nie.
Nie mogę uzyskać dobrych danych, ponieważ każdy serwer ma mieszankę sprzętu.
W mojej ostatniej firmie działało około 2000 serwerów Dell R210 R410 R710 Powiedziałbym, że średnio mieliśmy około 5 serwerów dziennie, które miały jakąś awarię. Tak więc około 0,25% serwera uległo awarii i potrzebowało wymiany części przed ponownym użyciem.
W mojej ostatniej firmie wszystko było skonfigurowane w parze HA, infrastruktura N + 2, więc nie miało to wpływu na produkcję. Udało nam się wymienić serwery i kontynuować pracę
W moim obecnym biurze obsługujemy 9 serwerów (HP Gen9, Hyper-V 56 VM), nie trzymamy pod ręką wielu części zamiennych, a centrum danych nie jest zarządzane, więc jeśli coś umrze, musimy jechać około 45 minut, aby wymienić byle co.
Mój CTO ani kierownik działu IT wydają się martwić, w zeszłym roku mieli około 2,5 dni przestoju, staram się klastra serwerów, ale nie widzą potrzeby.
Czy jest tu coś nie tak? Nie jestem pewien, co robić.
Wiem, że to nie moja odpowiedzialność, jeśli coś się stanie, to na CTO. To bardzo mała firma, tylko CTO, IT Manager, ja (deweloperzy) i 1 facet z działu pomocy technicznej.
Ponad całe doświadczenie w zarządzaniu środowiskiem produkcyjnym jest bardzo ograniczone, ponieważ sposób konfigurowania wielu rzeczy nazwałbym poziomem bardzo młodszym, ani mój dyrektor ds. Technologii, ani kierownik IT nie wiedzieli dużo o klastrowaniu, zanim tam dotarłem. Byli w trakcie projektu ustawiania DR bez HA, z którym wróżyłem, ale przegrałem.