Mam 15 identycznych 64-bitowych serwerów Linux RH 4.7. Prowadzą bazę danych klastrów (klaster jest na poziomie aplikacji). Czasami (co miesiąc) losowe pudełko (choć nie takie samo) zawiesza się.
Mogę pingować pudełko i ping działa. Jeśli spróbuję ssh w polu otrzymuję:
ssh_exchange_identification: Connection closed by remote host
SSH jest poprawnie skonfigurowany.
Kiedy idę do serwerowni i próbuję zalogować się bezpośrednio do konsoli, mogę przełączać konsole za pomocą Alt+ Fn, mogę wprowadzić nazwę użytkownika, a znaki się wyświetlają, ale po naciśnięciu Enternic się nie dzieje. Czekałem 8 godzin i to się nie zmieniło.
Syslog skonfigurowałem tak, aby rejestrował wszystko na zdalnym hoście i w tych dziennikach nie ma nic. Po ponownym uruchomieniu komputera działa bez problemu. Przeprowadziłem testy sprzętu - wszystko jest w porządku i nic nie jest w logach. Maszyny są również monitorowane za pomocą NAGIOS, i nie ma nietypowego obciążenia lub aktywności przed zamrożeniem.
Skończyły mi się pomysły; co jeszcze mogę zrobić lub sprawdzić?