Komputery są znacznie lepsze niż ja w analizowaniu danych. Osobiście wolę systemy takie jak OpsView, które analizują sytuacje i oferują wieloaspektowy interfejs. Statystyki monitorowania są filtrowane pod kątem nietypowych warunków, a indywidualne powiadomienia są dostarczane do administratorów odpowiedzialnych za system. Ogólny pulpit nawigacyjny dotyczący zdrowia, który można wyświetlić w dziale pomocy technicznej i zarządzaniu, daje wrażenie, jak źle jest awaria i czy ktoś, kto może to naprawić, już nad tym pracuje. Obracają go na dużym ekranie jako coś, co widać na pierwszy rzut oka, a nie coś, na co patrzysz przez cały dzień. Przewijanie tekstu i miganie lampek nie są sposobem, w jaki wynagrodzeni pracownicy powinni komunikować się z systemami monitorowania.
Conrad Albrecht-Buehler ma Google Techtalk („Making Monitoring Suck Less”), który omawia zalety i wady, jakie widzi w obecnym projekcie interfejsu użytkownika, i proponuje pewne ulepszenia. Nie wiem, czy opublikował kod, czy nawet swoją pracę magisterską. Ogólna idea jest prosta:
- Definiujesz monitorowanie sytuacji jako przechwytywanie zestawu sygnałów o stanie. Załaduj, wolne miejsce na dysku, ruch sieciowy, a nawet rzeczy na wyższym poziomie, takie jak posty na forum na godzinę.
- Następnie definiujesz funkcję słuchową, która odwzorowuje szeroki sygnał wejściowy od 0 do 1, przy czym 0 oznacza „ignoruj”, a 1 oznacza „zomg!”. W odniesieniu do Nagios, zastępuje stan OSTRZEŻENIE liczbą całkowitą OSTRZEŻENIE.
- Na koniec definiujesz agregator, który podsumowuje i nadaje priorytet tym sygnałom OSTRZEŻENIA.
Jeśli chodzi o konkretne narzędzia, których użyłbyś do napisania własnego systemu monitorowania, skrypty Nagios mają przyzwoity interfejs (prawdopodobnie tutaj możesz przykleić mapowanie HEED, jeśli ci się podoba), przechowywanie sygnałów można wykonać za pomocą rrdtool i z tego możesz generować wykresy, a istnieje aplikacja Django o nazwie Graphite, która renderuje bazy danych rrd. Istnieje również Nagvis :
NagVis to dodatek do wizualizacji znanego systemu zarządzania siecią Nagios.
NagVis można wykorzystać do wizualizacji danych Nagios, np. Do wyświetlania procesów informatycznych, takich jak system pocztowy lub infrastruktura sieciowa.