Inne osoby sugerują wysyłanie regularnych wiadomości, które mówią, że wszystko jest w porządku, ale osobiście nie zgadzam się z tym. Monitorowanie powinno być ciche, chyba że wystąpi problem i nigdy nie powinno polegać na tym, że użytkownik zauważy, że coś jest nie tak, jak „Och, nie dostałem tej codziennej wiadomości e-mail od kilku dni”. Zwłaszcza jeśli więcej niż jedna osoba odpowiada na alerty, każda może myśleć, że druga osoba już usunęła codzienny komunikat „Wszystko w porządku”.
Mamy zewnętrzną usługę (której są setki, ale używamy robaków ) do przeprowadzania kontroli HTTP naszego serwera monitorowania, aby upewnić się, że działa i może połączyć się z Internetem. To nasza główna troska o monitorowanie tego. Następnie nasz serwer Nagios monitoruje wszystkich serwerów Nagios naszych klientów.
Ale poruszasz dobrą rację. Prawdopodobnie powinniśmy dodać adres URL HTTP, który sprawdza kolejki postfix i jeśli to pokazuje niezwykłą liczbę wiadomości, które prawdopodobnie oznacza, że ma każdy w kolejce, a następnie podnieść alarm. Inną opcją byłoby użycie różnych metod powiadomień, powiedzmy, że agent dostarczający SMS-y inny niż SMTP, a także SMTP, których obecnie używamy.
W naszym przypadku nie pamiętam jednak, że kiedykolwiek mieliśmy śmierć serwera pocztowego. Oczywiście wszystko, do czego służy serwer pocztowy, to wysyłanie alertów Nagios, więc konfiguracja jest bardzo prosta i prawie nigdy się nie zmienia.