Chociaż nie było to do końca zadanie, musiałem wyjść z wymuszonego przestoju.
Kiedyś byłem SA dla dość dużej strony finansowej. Wiedzieliśmy, że nasze systemy są wewnątrz i na zewnątrz, mamy scentralizowane rejestrowanie i świetne narzędzia do ich przeglądania.
Nagle (naturalnie bardzo blisko terminu) wszystkie telefony komórkowe szaleją z komunikatami ostrzegawczymi. Sprawdź, czy witryna nie działa, a wszyscy pracownicy SA porzucają to, co robią, i rozpoczynają badanie.
Dzienniki Apache były w porządku, baza danych nie zgłaszała żadnych błędów, a pamięci podręczne wirowały dobrze. Mnóstwo wolnych zasobów, sieć działała poprawnie i nie było żadnych ostatnich wdrożeń.
10 minut później dowiaduję się, że jeden z programistów uzyskał dostęp do witryny i dodał kostkę (); w niejasnym module związanym z generowaniem strony.
Innymi słowy, oprogramowanie zrobiło to, co mu kazano, i nie było żadnych informacji w dzienniku, które by pomogły.
GM dla firmy, która prowadziła witrynę, uśmiechnął się szeroko i powiedział, że chce nas zegarować. Powiedziałem mu, żeby odrzucił, a nie dotknął moich serwerów produkcyjnych, że mieliśmy świetne plany odzyskiwania po awarii, ale niekompetencja jego dewelopera sprawiła, że żaden z tych planów nie został uruchomiony.
Gdyby chciał sprawdzić nasz czas reakcji, powinien przynajmniej omówić to z CTO i zapytać, czy mógłby to zrobić „dzisiaj” lub „w tym tygodniu”. W ten sposób nikt nie byłby wkurzony i nie marnowalibyśmy czasu na kłótnie.
Całe wydarzenie było jednym z najbardziej nieprofesjonalnych, jakie do tej pory spotkałem.