Robiłem aktualizacje oprogramowania układowego przełączników HP. Ulepszono dwa różne modele:
- Przełącznik ProCurve 5406zl Intelligent Edge (J8697A): zaktualizowano z K.15.06.0008 do K.15.12.0012
- Przełącznik HP 2520-24G-PoE (J9299A): zaktualizowano z wersji J.14.54 do wersji J.15.09.0021
Sprawdzając każdy przełącznik zaraz po uruchomieniu nowego obrazu, zauważyłem coś:
- Przełączniki załadowały nowy obraz oprogramowania układowego bez błędów, a łączność została odzyskana, gdy tylko przełącznik się uruchomił. W tym momencie zużycie procesora było niskie (poniżej 10%)
- Kilka sekund później zużycie procesora wzrosło do 100% i utrzymywało się przez kilka minut. Nie mogłem wykryć w tym momencie żadnego problemu poza CLI poprzez SSH, który jest trochę powolny: normalna łączność, brak komunikatów w dzienniku ...
- Po pięciu do dziesięciu minutach na 100% procesor wrócił do normy bez żadnych zmian z mojej strony.
Oba modele miały takie zachowanie. Wycofałem jedną jednostkę każdego modelu do poprzedniego obrazu oprogramowania układowego i działały one w ten sam sposób.
Mimo tego gwałtownego wzrostu CPU zaraz po starcie nie spowodowałem żadnego problemu, zastanawiam się czy normalne zachowanie sieci może być przyczyną tego gwałtownego wzrostu, ale nie sądzę. Rozważyłem następujące aspekty:
Zaraz po uruchomieniu STP uruchamia się, generując jednostki BPDU i cyklicznie wszystkie porty w przełączniku przez stany blokowania, słuchania, uczenia się i przekazywania. Jednak nawet w przypadku 802.1D proces ten nie trwa dłużej niż 1 minutę przy domyślnych licznikach czasu. Ponadto sprawdzałem przełączniki przez SSH, więc wszystkie obliczenia STP były już wykonane, zanim mogłem połączyć się z przełącznikiem.
Tuż po uruchomieniu tablica adresów MAC jest pusta i do przesłania pierwszych ramek potrzebna jest rozgłoszenie. Ale wątpię, aby ta transmisja zajęła 100% procesora, a tym bardziej mniej przez 5 minut, w przełączniku 24-portowym.
Wszystkie przełączniki działające jako urządzenia L2, brak funkcji L3, więc odrzucam routing i inne procesy L3.
Czy brakuje mi czegoś „normalnego” w operacjach sieciowych, które mogą wyjaśnić to użycie procesora przez 5 minut po ponownym uruchomieniu, zachowując łączność? Może jest to jakiś proces w tle, który przełącza się zaraz po restarcie?