Trudno jest podać konkretne odpowiedzi, ponieważ 90% tej pracy to doświadczenie, które uczy, gdzie szukać problemu, a pozostałe 90% wie, gdzie szukać w Google, aby uzyskać wskazówki, od czego zacząć.
Zazwyczaj próbuję papierowych toreb, takich jak nakłonienie klienta do zademonstrowania problemu (głównie w celu wykluczenia problemów z palcami i wszelkich problemów, które klient mógł opisać swój problem), a następnie próbę skopiowania problemu na innym komputerze. Takie postępowanie często daje wgląd w to, gdzie szukać.
Nie zapomnij o problemie naprawczym ponownego uruchomienia komputera, szczególnie w systemach Windows, nawet dzisiaj. Kiedyś tak było, że pytałem ludzi „Czy uruchomiłeś się ponownie? Spróbuj tego i daj mi znać, jeśli problem będzie się powtarzał” - to naprawiło bardzo duży procent problemów, o które mnie pytano.
Często występują również problemy z rozwiązywaniem problemów z DNS i podstawową łącznością (listy ACL na routerach, luki w sieci, pingi / traceroutes / mtrs do zdalnych witryn itp.).
W przypadku usług, nad którymi masz bezpośrednią kontrolę, uruchamianie nagios lub coś, aby upewnić się, że usługa faktycznie działa, może często powodować problemy, zanim klienci powiedzą ci o nich. Prawdopodobnie chcesz także zbierać statystyki, albo bezpośrednio przez Munina lub coś, albo przez SNMP do czegoś takiego jak Kaktusy.
Zwykle staram się, aby Kaktusy działały na co najmniej wszystkich moich głównych przełącznikach i zaporach ogniowych; w miarę możliwości uruchamiam kaktusy przeciw wszystkim, co mogę. W takich przypadkach zwykle szukam rzeczy takich jak liczba błędów portów lub nadmierny ruch. Wykresy zapory ogniowej z niektórych urządzeń mogą pokazywać użycie procesora i równoczesne sesje; dowiesz się, na jakich progach urządzenie zaporowe zaczyna mieć problemy.
Zapora może być w stanie zalogować się do urządzenia syslog; jeśli tak, zaloguj wszystko, co możesz i przejrzyj te podpowiedzi. Będzie to łatwiejsze, jeśli uruchomisz coś takiego jak syslog-ng lub rsyslog lub splunk, który pozwala nieco podzielić dzienniki zamiast zajmować się jednym plikiem monolitycznym.
Staram się również uruchamiać nfsen przynajmniej na wewnętrznej stronie mojej zapory ogniowej i, jeśli to możliwe, na łączu do dostawcy Internetu. To pozwala cofnąć się w czasie, aby spojrzeć na sesje i zobaczyć, kto co robi; czasami może to złapać ciekawe zachowania.