Jakiego narzędzia używasz do monitorowania swoich serwerów?


187

Bardziej wyczerpującą listę narzędzi do monitorowania i ich funkcji znajdziesz na tej stronie w Wikipedii .

Jak brzmi pytanie, jakie są najczęściej używane narzędzia do tego zadania i jakie są ich mocne i słabe strony?


Na jakiej platformie działa Twój serwer?
Glenn Slaven

1
Na moich serwerach działa Debian Lenny, ale pytanie nie koncentruje się głównie na samym monitorowaniu systemu UNIX, ponieważ wiele narzędzi prawdopodobnie będzie miało jakąś formę wsparcia międzyplatformowego.
Aron Rotteveel

Może używają różnych narzędzi, ale z ogólnego systemowego punktu widzenia ciągle robisz to samo w różnych systemach. To tylko trochę skryptu, aby wycisnąć ostatnią potrzebną część danych. W tym kontekście uważam „narzędzia” za instancję rejestrującą (serwer monitorowania), a nie za właściwą wtyczkę / skrypt, który
wyrzuca

Lubię również monitorować aplikacje (wydajność, dostępność itp.). Wydaje się, że narzędzia do monitorowania mają spektrum z możliwością monitorowania sprzętu z jednej strony i możliwością monitorowania aplikacji z drugiej strony. Sprzęt <----- + -----> Aplikacja
Nathan Hartley

Odpowiedzi:


136

Z powodzeniem korzystałem z Nagios . Jest bardzo rozszerzalny (ponad 200 dodatków), stosunkowo łatwy w użyciu i wiele raportów. Negatyw byłby początkową konfiguracją.


10
Nagios świetnie sprawdza się w monitorowaniu wszystkich typów hostów (Windows, Linux, routery, przełączniki itp.) Polecam korzystanie z narzędzia konfiguracyjnego takiego jak owocowy lub Lilacto, aby złagodzić ból związany z konfiguracją. NSClient ++ w oknach Windows i nagios-statd w Linuksie do monitorowania uruchomionych procesów, użycia dysku itp.
TonyB

Niestety Nagios wymaga agenta na komputerach z systemem Windows - w przeszłości zdarzało mi się, że agent ma tendencję do przypadkowego umierania.
PowerApp101

W celu monitorowania monitorowaliśmy zarówno Nagios, jak i Zabbix. Zabbix wygrał po krótkiej ocenie, głównie ze względu na łatwość wdrożenia i funkcjonalność (na przykład Zabbix zawiera wykresy jako podstawową funkcję, podczas gdy Nagios wymaga wtyczki). Stwierdziłem, że konfigurowanie Nagios było uciążliwe.

GroundWork OpenSource ma urządzenie do monitorowania sieci, które w swoim rdzeniu wykorzystuje Nagios i upraszcza konfigurację / zarządzanie
Rog

12
Jest nowy widelec nagios o nazwie icinga. Nigdzie jeszcze nie ma, ale ich cele wyglądają obiecująco. icinga.org
cstamas

70

Cacti to bardzo dobra internetowa nakładka do RRDTool , zapewniająca bardzo przydatne wykresy i statystyki. RRDTool to część, która gromadzi dane z wielu systemów i monitoruje szeroki zakres danych technicznych.

Używamy tego rozwiązania kaktusów / RRDTool do monitorowania systemów Unix i Windows. Otrzymujemy wiele przydatnych danych, w tym obciążenie, użycie procesora / pamięci RAM, przestrzeń HD, zalogowani użytkownicy, ruch sieciowy, uruchomione procesy i tak dalej.

Więcej informacji na temat kaktusów znajdziesz na stronie Czym jest kaktus? strona.


Kaktusy to zabawne rozwiązanie, które wygląda świetnie i ma świetną cenę (za darmo). Jednak konfiguracja urządzeń sieciowych jest PITA i była słabo udokumentowana. Teraz może być lepiej, ale nie zobowiązałbym się do tego, dopóki nie przeprowadzisz badań.
Chris Porter

57

Osobiście uwielbiam Munin, który jest bardzo łatwy w instalacji i pisaniu wtyczek, ponieważ ma bardzo prostą architekturę. Istnieje już wiele wtyczek do wszystkich celów, jakie możesz sobie wyobrazić, więc prawdopodobnie nie będziesz musiał nawet pisać wtyczek.

Zapewnia również piękne wykresy i opcję konfiguracji (bardzo podstawowych) alertów.


2
Jestem też wielkim fanem Munin. Obsługuje integrację z Nagios (dzięki czemu można uruchomić oba) i obsługuje wszystkie popularne smaki Uniksa. Nie sądzę, aby istniało jakiekolwiek wsparcie dla monitorowania węzła Windows - jednak jest napisane w Perlu, więc chociaż może być nietrywialne, z pewnością powinno być możliwe .
John Dalton

2
@Jan. Węzeł Windows jest obsługiwany albo przez Munin-node-win32, który jest natywnym węzłem Munin, albo przez SNMP, jak każdy inny host.
Steve Schnepp

34

Zabbix . Jest to oprogramowanie typu open source i dość proste w konfiguracji i dostosowaniu. Mamy wiele niestandardowych skryptów monitorujących, które zasilają serwer zabbix, ale zajmuje się centralizacją tych danych, odpowiednim ich wyświetlaniem, powiadomieniami (e-mail, IM, SMS, Twitter itp.) I tak dalej.


2
Używamy również Zabbix i przekonujemy się, że jest dość wydajny i konfigurowalny. Testowaliśmy zarówno Zabbix, jak i Nagios, i ostatecznie zdecydowaliśmy się na Zabbix, ponieważ chociaż Nagios wydaje się mieć dobrą reputację, instalacja jest trochę uciążliwa, a wiele funkcji pochodzi z wtyczek, a nie z podstawowej aplikacji (wykresy to dobry przykład, otrzymujesz to za darmo z Zabbix).

3
Wolę Zabbix, ponieważ zapewnia elastyczność w zakresie tworzenia wykresów i mapowania infrastruktury (pod względem dostępności), a także elastyczny sposób monitorowania.
Andrioid

29

Robiłem roll- upy Spiceworks w naszej firmie i uważamy, że jest to świetne narzędzie nie tylko do monitorowania serwerów, ale i wszystkiego innego w sieci.

Robi takie rzeczy, jak automatyczny inwentaryzacja i niestandardowe monitorowanie, aby wysyłać Ci e-maile, gdy występuje problem (EG: Drukarka ma do 10% atramentu lub dysk twardy tego serwera ma 20%).

Jego wadą byłaby prawdopodobnie gęstość informacji na komputer, nie zrozumcie go źle, ma DUŻO danych na maszynę, ale w przypadku takich rzeczy, jak serwery, na których można chcieć wielu statystyk, może być konieczne użycie innego narzędzia.

EDYCJA: och, wspominałem, że jego model biznesowy opiera się na tym, że jest na zawsze wolny.


Spiceworks robi wiele niesamowitych rzeczy - i ZA DARMO.

3
SpiceWorks ma naprawdę dużą społeczność, która dość często pokrywa się z ServerFault. Ciekawe będzie wzajemne oddziaływanie społeczności. Używam również SpiceWorks. Niesamowite narzędzie.
Scott Alan Miller

Teraz używam tego w oparciu o twoją rekomendację. Doskonałe narzędzie.
Marko Carter

Używamy go w naszej pracy. To całkiem imponujące. Sam spis sprzętu, nie mówiąc już o oprogramowaniu, jest wart obejrzenia sam.
Terry

Ostatnim razem, gdy używałem Spiceworks (coś w wersji 3), nie było sposobu, aby dodać lub zmodyfikować komponenty sprzętowe, takie jak monitory, karty graficzne itp. Wykrywa je, ale często nieprawidłowo. Dlatego nadal używam GLPI + OCSNG, którego nienawidzę .
Boden

18

Zadymienie nie tylko sprawdza dostępność różnych serwerów i usług, ale także śledzi ich opóźnienie, zapewniając jednocześnie łatwe w użyciu, ładne i szybkie wyświetlanie wykresów.

Szeroki zakres wtyczek do pomiaru opóźnień jest dostępny od razu po wyjęciu z pudełka. Jeśli znasz trochę Perla, łatwo jest stworzyć własne dla wszelkich egzotycznych potrzeb.

Duże instalacje skorzystają z systemu Master / Slave do pomiarów rozproszonych.

Wysoce konfigurowalny system ostrzegania pomoże Ci zauważyć problemy, zanim zaczną wpływać na użytkowników lub przerodzić się w poważną awarię.

Smokeping jest darmowy i oprogramowanie OpenSource napisane w Perlu przez Tobi Oetiker, twórcę MRTG i RRDtool


Dymienie dobrze jest zobaczyć, jak wygląda twoja sieć
Rory,

Palenie jest niesamowite do wizualizacji opóźnień.
James

15

OpenNMS jest używany tam, gdzie pracuję, aby monitorować ponad tysiąc komputerów z systemem Linux. Monitorujemy sprzęt każdej maszyny i działające na niej aplikacje.


+1 dla OpenNMS, używamy tego również w pracy do monitorowania tysięcy maszyn i interfejsów. Mamy wiele różnych systemów operacyjnych i jesteśmy w stanie monitorować je wszystkie za pomocą OpenNMS.
Steve K

nie mój pierwszy wybór, ale bardzo przydatny

jak to jest z dodawaniem baz MIB do nowego sprzętu?
slovon

OpenNMS ma już wiele statystyk snmp w domyślnej konfiguracji, dzięki czemu może automatycznie wykryć i rozpocząć tworzenie wykresów po wyjęciu z pudełka. Nowe statystyki SNMP są dość łatwe do dodania, wystarczy podać nazwę RRD, OID i typ danych i umieścić je w grupie dla typu urządzenia, którego dotyczy.
mtinberg,

15

Zenoss Core ma jakieś zastosowanie, używamy go (przez około rok) do lekkiego monitorowania serwerów, przełączników sieciowych i UPS.

Zenoss Core to wielokrotnie nagradzany produkt monitorujący IT typu open source, który skutecznie zarządza konfiguracją, kondycją i wydajnością sieci, serwerów i aplikacji za pomocą jednego zintegrowanego pakietu oprogramowania.


Jeśli korzystasz z darmowej wersji Zenoss Core, przygotuj się na wiele ulepszeń SNMP MIB. Odkryłem również, że stanowczo odmawiał gromadzenia danych systemu operacyjnego na niektórych moich serwerach i jest zaskakująco trudny do skonfigurowania w przypadku prostych zadań, takich jak sprawdzanie zawartości strony internetowej.
gareth_bowles

Może współczuć z problemami MIB, ale sprawdzanie stron internetowych można wykonać za pomocą wtyczek Nagios na Zenoss.
gimel

12

Nagios jest świetny, ponieważ jest darmowy i zawiera wiele wtyczek. Jednak interfejs użytkownika i konfiguracja są bardzo trudne.

Jest dokładnie odwrotnie w pro / con's, który jest również świetny, że Microsoft System Center Operations Manager (SCOM) nie jest darmowy, ma mniej wtyczek, ale konfiguracja i konfiguracja są genialne i łatwe.

Muszę przyznać, że jeśli pracowałem głównie w firmie Microsoft, miałem bardzo wysokie wymagania co do niezawodności (tj. Nie stać mnie na monitorowanie, aby się zepsuć) lub musiałem pomyśleć o zmuszeniu programistów do współpracy, SCOM byłby moim zaleceniem w stosunku do Nagios.


12

Użyłem:

  • Nagios - wymaga starej konfiguracji wiersza poleceń, nie ładnej, ale solidnej i funkcjonalnej. Został zastąpiony przez:
  • Zenoss - wymaga znacznie mniej pracy nóg, ma wariant komercyjny. Po uruchomieniu reszta jest kontrolowana przez przeglądarkę. Bardzo wydajny, ale wymaga nieco pracy MIB, jeśli korzystasz z darmowej wersji.
  • Intermapper - program komercyjny, oszczędny , jeśli masz wiele węzłów do monitorowania. Wygląda na napisany w Javie (na lepsze lub gorsze).
  • Spiceworks - nie wypróbowałem najnowszej wersji. Starsze wersje wymagały nieco więcej umph pod maską, aby zareagować, ale w przeciwnym razie działa ładnie. Darmowa wersja zawiera reklamy nag.

Intermapper intensywnie korzystamy.
sysadmin1138

Używam również InterMapper. Klient konsoli jest napisany w Javie. Serwer jest napisany w języku Python. Postgres służy jako baza danych zaplecza do agregacji danych i raportowania.
lsiu

11

Korzystamy z AlertFox od kilku tygodni i jesteśmy z tego bardzo zadowoleni. Nie tylko sprawdza naszą dostępność i wydajność, ale także monitoruje koszyk, login użytkownika i inne krytyczne części witryny za pomocą skryptów transakcyjnych (opartych na iMacros).

Do naszego wewnętrznego monitorowania (miejsca na dysku itp.) Używamy Nagios .


10

Monitor sieci PRTG - nie mogę powiedzieć wystarczająco dużo wspaniałych rzeczy na ten temat. Niesamowity interfejs internetowy, a szczególnie doskonały do ​​monitorowania routerów (przepustowość itp.) I innych urządzeń za pośrednictwem SNMP i pomiaru czasu dostępności SLA itp.

www.paessler.com


9

Jako osoba Windows, MOM. Chcemy uaktualnić do System Center Operations Manager (SCOM), ale nie będziemy musieli, dopóki nie zaczniemy wdrażać systemu Windows 2008.


Używam również MOM. Uwielbiam to i nienawidzę jednocześnie.
spoulson

SCOM to świetna platforma monitorowania dla środowisk korporacyjnych opartych na Windows. Prawdziwym geniuszem są pakiety zarządzania wydane przez same grupy produktów Microsoft (jest to część MS Common Engineering Criteria, że ​​każdy produkt ma SCOM MP w ciągu 90 dni od RTM). Uzyskiwanie porad i wiedzy od samych zespołów produktowych może znacznie poprawić zdolność działu operacyjnego do utrzymania sprawności i zdrowia bez zawracania głowy starszym administratorom przy każdej drobnej rzeczy.
Kevin Colby,

8

Jestem częścią projektu aktualizacji monitorowania operacyjnego. Mieliśmy różnych dostawców, którzy przybyli na miejsce, aby zaprezentować kilka dużych systemów dolarowych i połączyliśmy kilka tańszych alternatyw do porównania.

Jednym z nich jest Hyperic , który jest również dostępny jako bezpłatne rozwiązanie open source. Byłem pod wrażeniem dostarczonych możliwości i możliwości rozszerzenia dla niestandardowych agentów.


Chociaż zasoby nie są łatwe, z pewnością jest to świetne narzędzie do monitorowania!
Vincent De Baere

8

Do monitorowania statystyk (użycie pamięci, obciążenie, aktywność mysql, aktywność apache itp.) Używam Munin . Po wyjęciu z pudełka śledzi już wiele rzeczy i drukuje wykresy dla różnych przedziałów czasowych (ostatnie 24 godziny, ostatnie 7 dni, ostatni miesiąc, ostatni rok). Dzięki wtyczkom można monitorować jeszcze więcej rzeczy. Dane wyjściowe to strony HTML z ładnymi wykresami.

Munin ma architekturę master / node: węzły zbierają statystyki na serwerze, a master przechowuje dane i tworzy HTML i wykresy.

Używam Monit do śledzenia uruchomionych procesów oraz do restartowania lub powiadamiania mnie, gdy pojawią się pewne konfigurowalne warunki (wysokie obciążenie procesora, wysokie zużycie pamięci, brak odpowiedzi HTTP itp.) Monit może również monitorować bardziej ogólne rzeczy na temat serwera, takie jak procesor obciążenie, użycie pamięci, stan dysku twardego lub użycie dysku.

Monit należy skonfigurować dla każdej usługi lub sprzętu, który chcesz monitorować i jak reagować, gdy coś pójdzie nie tak. Najczęściej używane opcje to nic nie robić, wysłać e-mail z ostrzeżeniem lub ponownie uruchomić usługę.

Monit jest świetny, gdy działa, ale czasami nie uruchamia się, nie zatrzymuje ani nie uruchamia ponownie usługi, a nie ma zbyt wielu informacji diagnostycznych, aby powiedzieć, co poszło nie tak. Oznacza to, że nie wiesz, czy problem dotyczył Twojej usługi, czy konfiguracji Monit, która działa z minimalnym środowiskiem podobnym do crona.

Oba narzędzia są domyślnie dostępne w większości dystrybucji Linuksa.


8

Dziwię się, że nikt nie wspominał o logwatch'u ani logcheck dla serwerów Linux - oszczędza mnóstwo czasu na czytaniu logów !!


Narzędzia te naprawdę nie zapewniają danych i długoterminowej czytelności trendów w infrastrukturze. Są miłym dodatkiem, ale nie polegałbym wyłącznie na nich. Afaik „logwatch” jest nieco zły, ponieważ będzie raportować tylko o błędach, o których mu mówisz, w przeciwieństwie do „logcheck”, w którym powiadamiasz narzędzie o znanych dobrych rzeczach i będzie raportował wszystko inne.
serverhorror


7

Nasz projekt wykorzystuje Ganglia dla ponad 100 naszych klastrów węzłów. Jednym z powodów, dla których go używamy, jest to, że jest to narzędzie do monitorowania dostarczane z Rocks .

Ważne jest, abyśmy mieli bardzo niski narzut na każdym węźle, aby jak najwięcej zasobów było dostępnych do obliczeń. Ganglia daje nam dobry przegląd klastra i pozwala nam przejść do poszczególnych węzłów w razie potrzeby. Poza tym wiemy, co się teraz dzieje, możemy dobrze przyjrzeć się temu, co wydarzyło się w ciągu ostatniej godziny, dnia, tygodnia, miesiąca i roku. Wykresy różnych statystyk są podstawowe i funkcjonalne.


6

Wszystko zależy od tego, co rozumiesz przez „monitor”!

  • Czy jest dostępny (system lub usługa)? Używamy nagios .
  • Co to robi? Używamy munina do serwerów linuksowych i kaktusów do niemal wszystkiego innego, nawet jeśli czasami konfigurowanie ...
  • Co to zrobiło? Używamy syslog-ng do koncentrowania syslogów w jednym miejscu, a następnie codziennie uruchamiamy dostosowany skrypt logowania, aby wysyłać raporty pocztą elektroniczną. Szukamy czegoś podobnego do serwerów Windows.

5

Nowym uczestnikiem na scenie, który chce sprawdzić się w rywalizacji z Cacti i rozwiązaniami opartymi na RRDTool, jest Graphite ( http://graphite.wikidot.com/ )

RRDTool zastąpiono sklepem o nazwie Whisper. Dokumenty dają całkiem dobry przegląd tego, co się różni i naprawdę podoba mi się CLI do grafik ad hoc podczas badania czegoś.


4

Używamy (i lubię) WhatsUp od Ipswitch dla naszej stosunkowo małej sieci Windows. Jest łatwy w konfiguracji i stosunkowo łatwy w zarządzaniu oraz wie, jak postępować z serwerami Windows, a także ze standardowymi czynnościami.

W przypadku większych sieci, sieci innych niż Windows lub sieci z wieloma różnymi rzeczami, szczerze polecam OpenNMS . Oprogramowanie OpenNMS jest bezpłatne, a firma chętnie sprzedaje usługi wsparcia i wdrażania. Zdarza się też, że jest prowadzony przez mojego bardzo ostrego kolegę ze studiów!


4

Dla tych, którzy nie lubią interfejsu internetowego Nagios, jest NPC , wtyczka do Cacti, która udostępnia interfejs Nagios z poziomu Cacti, ale z lepszym wyglądem (ajax itp.).

Czyta z bazy danych dostarczonej przez NDO2DB , co jest doskonałym sposobem na udostępnienie infrastruktury z bazy danych do użycia w skryptach i innych narzędziach.


4

Obecnie używamy PRTG od Paessler . To jest świetne. Nie są wymagane żadne agenty, doskonały interfejs sieciowy Ajax, rejestrowanie danych historycznych, wykresy, WMI itp. Dostępna jest darmowa wersja z 10 czujnikami, ale zdecydowaliśmy się na kilka wersji dla wersji Enterprise. Dobrze wydane pieniądze.



4

Jeśli się spieszysz i chcesz szybkiego narzędzia do monitorowania serwera MS, użyj monitora wydajności dla systemu Windows, skonfiguruj dziennik liczników z niestandardowym szablonem monitorowania i harmonogramem klienta (np. Zbieraj dane przez 5 minut co godzinę). Następnie pobierz Microsoft LogParser i Codeplex's Performance Analysis of Logs (PAL) Tool ( http://pal.codeplex.com/ ), aby złamać swój licznik. PAL wygeneruje świetny udokumentowany raport z linkami do możliwych dokumentów / narzędzi rozwiązywania problemów.


3

Używam kombinacji Solarwinds, kart wydajności serwera VMware i niestandardowych skryptów.

Monitor wydajności sieci Solarwinds Orion jest tym, czego używam z naszym systemem Windows. administratorzy na moich serwerach internetowych. Nadal otrzymuję kilka użytecznych wskaźników aplikacji, ale ma dobre informacje na temat podstawowych rzeczy na poziomie pudełka (dysk, sieć, procesor).

Dla moich gości VMware uwielbiam karty wydajności.

Na moich serwerach Sun, gdy potrzebuję czegoś, co nie jest dostępne w Solarwinds (ponieważ nasz administrator tego nie dodał lub co innego), piszę niestandardowe skrypty (zwykle w Perlu), aby monitorować takie rzeczy, jak stan lustra, użycie zamiany itp.

Chciałbym uzyskać więcej informacji na temat Solarwinds, ale jest tylko 26 godzin dziennie (przynajmniej tak uważa mój szef), więc uważam, że może to być odrobinę ograniczające ...


3

Używamy OpsView , który działa na Nagios. Interfejs webUI pomaga nam wdrażać nowe definicje monitorów hosta bez konieczności zezwalania na dostęp SSH, zapewnia widoki publiczne i rejestruje wartości historyczne. Jest to przydatne do udostępniania i określania odpowiednich linii bazowych.



2

Przykro mi to mówić, ale ostatecznie użyłem wielu niestandardowych skryptów. Choć dalekie od ideału, wątpię, że istnieje bardziej powszechne rozwiązanie.


Zawsze będą potrzebne niestandardowe skrypty!
Techboy

2

Napisaliśmy własne oprogramowanie monitorujące. Nasz kod nie jest tak wyrafinowany jak pakiet komercyjny, ale nie potrzebowaliśmy dużej funkcjonalności. Łatwiej było napisać własne niż zbadać inne pakiety i nauczyć się z nich korzystać. Kod robi dokładnie to, co chcemy i jest łatwy do rozszerzenia.


2
Myślę, że ważne jest, aby przemyśleć konsekwencje takiej decyzji. Pisanie czegoś od zera może nie być tak wielkim wysiłkiem - ale utrzymanie go na drodze to niedźwiedź.
Adam

Mogłem sobie wyobrazić, że konserwacja jest problemem, ale nie było to dla nas, mimo że korzystamy z tego systemu od lat. Ponieważ podstawa kodu jest niewielka i znana, łatwo było nam w razie potrzeby dodać nową funkcjonalność. Utrzymanie komercyjnego rozwiązania może z czasem stanowić problem, szczepienie na kawałkach od nowych dostawców, gdy oryginalny produkt nie robi wszystkiego, czego potrzebujesz itp.
John D. Cook
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.