Mam serwer HP ProLiant DL380 G7 działający jako jednostka pamięci NexentaStor . Serwer ma 36 GB pamięci RAM, 2 kontrolery LSI 9211-8i SAS (bez ekspanderów SAS), 2 dyski systemowe SAS, 12 dysków danych SAS, dysk zapasowy, pamięć podręczną Intel X25-M L2ARC i akcelerator DDRdrive PCI ZIL. Ten system obsługuje NFS na wielu hostach VMWare. Mam również około 90-100 GB deduplikowanych danych w tablicy.
Miałem dwa incydenty, w których wydajność gwałtownie wzrosła, pozostawiając gości VM i konsole Nexenta SSH / Web niedostępnymi i wymagając pełnego ponownego uruchomienia macierzy, aby przywrócić funkcjonalność. W obu przypadkach to dysk SSD Intel X-25M L2ARC zawiódł lub został „zarysowany”. NexentaStor nie powiadomił mnie o awarii pamięci podręcznej, jednak ogólny alert ZFS FMA był widoczny na (niereagującym) ekranie konsoli.
Dane zpool status
wyjściowe pokazały:
pool: vol1
state: ONLINE
scan: scrub repaired 0 in 0h57m with 0 errors on Sat May 21 05:57:27 2011
config:
NAME STATE READ WRITE CKSUM
vol1 ONLINE 0 0 0
mirror-0 ONLINE 0 0 0
c8t5000C50031B94409d0 ONLINE 0 0 0
c9t5000C50031BBFE25d0 ONLINE 0 0 0
mirror-1 ONLINE 0 0 0
c10t5000C50031D158FDd0 ONLINE 0 0 0
c11t5000C5002C823045d0 ONLINE 0 0 0
mirror-2 ONLINE 0 0 0
c12t5000C50031D91AD1d0 ONLINE 0 0 0
c2t5000C50031D911B9d0 ONLINE 0 0 0
mirror-3 ONLINE 0 0 0
c13t5000C50031BC293Dd0 ONLINE 0 0 0
c14t5000C50031BD208Dd0 ONLINE 0 0 0
mirror-4 ONLINE 0 0 0
c15t5000C50031BBF6F5d0 ONLINE 0 0 0
c16t5000C50031D8CFADd0 ONLINE 0 0 0
mirror-5 ONLINE 0 0 0
c17t5000C50031BC0E01d0 ONLINE 0 0 0
c18t5000C5002C7CCE41d0 ONLINE 0 0 0
logs
c19t0d0 ONLINE 0 0 0
cache
c6t5001517959467B45d0 FAULTED 2 542 0 too many errors
spares
c7t5000C50031CB43D9d0 AVAIL
errors: No known data errors
Nie wywołało to żadnych alertów z poziomu Nexenta.
Miałem wrażenie, że awaria L2ARC nie wpłynie na system. Ale w tym przypadku był to z pewnością winowajca. Nigdy nie widziałem żadnych rekomendacji dla RAID L2ARC. Całkowite usunięcie uszkodzonego dysku SSD z serwera przywróciło mnie do działania, ale martwię się o wpływ awarii urządzenia (a może także braku powiadomienia od NexentaStor).
Edycja - Jaki jest obecnie najlepszy wybór dysku SSD dla aplikacji pamięci podręcznej L2ARC?