Mamy niedawno miał mały problem z sieci, gdzie będzie wiele serwerów przerwami stracić łączność z siecią w dość bolesny do zdecydowania sposób (wymagany twardy restart). Trwało to około dwóch tygodni, na pozór losowych, na różnych serwerach. Żaden szczególny wzorzec, który moglibyśmy rozpoznać.
Po kilku zagłębieniach w nim zauważyliśmy, że przełącznik zgłasza 100 Mb / s dla problematycznego portu:
Brzmi to niezwykle podobnie do tego, co wydarzyło się w artykule Joela Spolsky'ego Five Whys
Michael poświęcił trochę czasu na sekcję zwłok i odkrył, że problemem był prosty problem z konfiguracją przełącznika. Istnieje kilka możliwych prędkości, za pomocą których przełącznik może się komunikować (10, 100 lub 1000 megabitów na sekundę). Możesz ustawić prędkość ręcznie lub pozwolić przełącznikowi automatycznie wynegocjować najwyższą prędkość, z którą mogą współpracować obie strony. Przełącznik, który zawiódł, został ustawiony na automatyczną negocjację. To zwykle działa, ale nie zawsze, a rano 10 stycznia tak się nie stało.
Wyłączyliśmy teraz automatyczne negocjacje na naszym sprzęcie sieciowym i ustawiliśmy stałą prędkość 1000 Mb / s (gigabit).
Moje pytania do osób posiadających większą wiedzę na temat sprzętu sieciowego do serwerów:
- Jak często występują problemy z automatycznymi negocjacjami z nowoczesnym sprzętem sieciowym?
- Czy uważa się za dobrą, standardową praktykę sieciową, aby wyłączyć automatyczne negocjowanie i ustawić stałe prędkości podczas konfigurowania sieci?