Ciągle się boję: adapter hosta przerywa błędy żądania po wykonaniu zalecanych kroków


9

Dostaję niesławny obawy: błąd żądania adaptera hosta przerwany z moim nowym kontrolerem RAID Adaptec przy wysokim I / O. Przeczytałem kilka forów, nawet Adaptecs , które ustawiają wartość / sys / block / sdX / device / timeout na 45, aby to naprawić. Korzystam jednak z systemu Ubuntu Server 12.04, który domyślnie ma już tę wartość 45. Wypróbowałem także następną sugestię, która polegała na zaktualizowaniu biografii mojego mobo do najnowszej wersji, co zrobiłem.

Nie jestem pewien, czy ktoś jeszcze napotkał ten błąd „aacraid: Żądanie przerwania adaptera hosta” nawet po wykonaniu tych kroków.

Oto, co widzę w moim dzienniku systemowym:

kernel: [ 5493.523282] aacraid: Host adapter abort request (4,0,0,0)
Jan  6 20:29:15 server kernel: [ 5493.523309] aacraid: Host adapter abort request (4,0,0,0)
Jan  6 20:29:15 server kernel: [ 5493.523375] aacraid: Host adapter reset request. SCSI hang ?

Oto moja nieznajoma -a

Linux server 3.2.0-29-generic #46-Ubuntu SMP Fri Jul 27 17:03:23 UTC 2012 x86_64 x86_64 x86_64 GNU/Linux

Dziękuje wszystkim,

Jim

Odpowiedzi:


1

Jeśli jeszcze tego nie rozwiązałeś, ostatnio zmagałem się z tym samym problemem, który szybko przerodził się w zawieszanie tablicy co 5 minut przez kilka minut wraz ze wzrostem IO. Ubuntu domyślnie korzysta z harmonogramu CFQ, który nie jest optymalny dla sprzętowej macierzy RAID. Przełącz harmonogram na noop za pomocą:

echo noop > /sys/block/<blockdevice>/queue/scheduler

Osobiście utknąłem w starym jądrze, ale powiedziano mi również, że aktualizacja do najnowszego sterownika awarii powinna rozwiązać problem - nie mogę tego jednak zweryfikować. Ale i tak przejdź na noop. Ponieważ sysfs nie jest stały, możesz chcieć ustawić harmonogram /etc/rc.locallub użyć elevator=parametru boot.

Zwrócę uwagę na inne parametry jądra, a także ustawienia Ubuntu są rozsądnymi ustawieniami domyślnymi dla większości popularnych urządzeń, ale przez większość czasu serwery wymagają specjalnej uwagi, niezależnie od tego, na jakiej dystrybucji się używasz.


1

Jeśli kontroler RAID Adaptec ma własne oprogramowanie układowe / BIOS, może być konieczna jego aktualizacja. Wystąpiły problemy podczas wysokiego we / wy i otrzymaliśmy komunikat „aacraid: Host adapter abort request”, a także zobaczyliśmy wydanie oprogramowania układowego nowszego niż nasze obecne, które mówiło „Naprawiono problem, w którym oprogramowanie mogło zawiesić się podczas dużego obciążenia we / wy”. http://download.adaptec.com/pdfs/readme/relnotes_arc_fw-b18937_asm-18837.pdf .

W powyższych informacjach o wersji wymieniono następujące modele Adaptec: 2045, 2405, 2405Q, 2805, 5085, 5405, 5405Z, 5445, 5445Z, 5805, 5805Q, 5805Z, 5805ZQ, 51245, 51645, 52445).

Mamy również wiersze dziennika, takie jak:

sd 0:0:0:0: timing out command, waited 360s

i

Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT,SUGGEST_OK

Szukając w Internecie, aby zobaczyć inne osoby mające podobny problem, znaleźliśmy kolejną linię kart, w której oprogramowanie układowe rozwiązało następujące problemy, które mogą być istotne:

Powyższe dwa dotyczą modeli Adaptec 7805, 7805Q, 78165, 71605E, 71605, 71605Q, 71685, 72405, 8805, 8885, 8885Q i 81605ZQ.


Myślę, że mój kontroler zawiesiłby się, gdy użyłem arcconfnarzędzia wiersza polecenia do sprawdzenia stanu tablicy w ramach naszych zwykłych skryptów monitorujących Nagios. Jak wskazują uwagi na temat oprogramowania wewnętrznego, użycie arcconfmoże spowodować zawieszenie się kontrolera.
Stefan Lasiewski
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.