Co jest lepsze: RAID5 + 1 Hotspare / RAID6? [Zamknięte]


45

Ciekawe, że mam 6 x 1 TB 7200 RPM na linię SAS dla mojego nowego serwera. Mogę skonfigurować go jako RAID5 + 1 Hot Spare lub RAID6.

Co mam wybrać


1
Spekuluję, że za 5 lat ... wiele osób będzie pytać ... co to jest RAID? Wkrótce wyjdzie za drzwi, ale nadal będzie aktualne na dziś.
Matt

1
Więc ponieważ wiele osób podaje opinie zamiast faktów, zamykamy temat i nie pozwalamy na omawianie faktów? To wydaje się złe. Trudna matematyka pokazuje, dlaczego RAID 6 jest lepszy ze względu na bezpieczeństwo, pojemność i wpływ na szybkość. Nie dotyczy to opinii.
Scott Alan Miller

Odpowiedzi:


36

Masz wady i zalety przy każdym podejściu; zależy to od tego, dlaczego używasz RAID. Większość ludzi używa go do dostępności. Nie chcą, aby dysk zginął i ostatecznie musieliby zdjąć system lub serwer. W tym przypadku nie używasz RAID 5. Nauczyłem się tego na własnej skórze i wnikam w ten punkt z każdym pytaniem związanym z macierzą RAID na SF.

Dlaczego? Ponieważ dyski stają się coraz większe, zwiększa się tolerancja URE, niemożliwe do odzyskania błędy odczytu. Zrobiliśmy to i nie jest to, co chcesz odkryć w trakcie przebudowy. Scenariusz: system RAID z 3 dyskami. Mamy alarm w naszym Dell z kartą sprzętową PERC, która zmarł dysk C. Zamów nowy dysk, wymień go, nie ma problemu. W połowie przebudowy zmarł.

Zgodnie z diagnostyką na dysku B. wystąpił „zły punkt”. System wielokrotnie powtarzał dyskretną awarię tego dysku, a teraz, gdy przebudowuje dane, nie mógł odczytać tego miejsca i nieważne ile razy przeprowadziliśmy naprawę nawet bezpośrednio ze sterownika i za każdym razem, gdy mówiono, że wszystko zostało naprawione, nie można go odbudować. Mamy więc jeden dysk martwy i jeden dysk, którego nie można odczytać z miejsca ... w końcu zastępujemy 2 dyski i przywracamy z kopii zapasowej.

Lekcja: RAID nie jest kopią zapasową, a RAID 5 nie jest już opcją dostępności dla większych dysków.

Jeśli chcesz zwiększyć prędkość lub rozmiary pamięci, możesz to zrównoważyć w swojej decyzji. Musisz zdefiniować swoje potrzeby w kategoriach potrzeb i celów, a nie w kategoriach „Potrzebuję RAID, z czego korzystam?”


1
Dyski przeznaczone do operacji RAID zazwyczaj bardzo szybko nie korygują błędów i zgłaszają awarię kontrolerowi. Chodzi o to, aby uniknąć sytuacji opisanych powyżej - zły blok zostaje ponownie mapowany, a dane odzyskiwane z parzystości, a nie dysk oznaczany jako zły, ponieważ „zawiesza się” przez 45 sekund podczas próby odzyskania tego bloku. Western Digital ma nawet narzędzie do zmiany zachowania odzyskiwania po błędach na swoich dyskach, chociaż narzędzie to nie jest „oficjalnie” wydane.
Chris

7
Nie mogłem śledzić argumentu. Mówisz, że używasz RAID 6 lub RAID 5?
Martin

@martin: Komentuję obawy, że niektóre rodzaje awarii dysków są obsługiwane w różny sposób, w zależności od docelowego projektu samego dysku. Martin opisał awarię wielu dysków w wyniku „złego miejsca” na dysku, który w niektórych sytuacjach nie spowoduje (i nie powinien) spowodować pełnej przebudowy macierzy. Podczas procesu przebudowy macierzy inny dysk uległ awarii, co spowodowało zły dzień.
Chris

@chris - Przepraszam za zamieszanie - nie komentowałem twojego komentarza. (Nie było go tam, kiedy pisałem.) Moje pytanie skierowane było do Barta: nie mogłem zrozumieć, czy mówił, że RAID 5 jest koniecznością, czy też RAID-5 nie wystarczy i wystarczy RAID 6.
Martin

2
@ Chris-Nie wiem już, czym byłoby różnicowanie, ale PERC są oparte na sprzęcie, wbudowanej pamięci podręcznej, zintegrowanych narzędziach do zarządzania, hot swap itp. I chociaż Dell niekoniecznie pobiera dziesięć wielkich opłat za serwery, są dość popularny w środowisku korporacyjnym. Dyski mają zgłaszać błędy; w ten sposób otrzymujesz komunikaty o błędach i alerty. Ale URE to coś, co dzieje się z dyskami i wydaje się, że nie zdają sobie z tego sprawy, dopóki nie zrobią czegoś takiego jak ... och ... przebudowanie tablicy. A potem nagle „Hej! Tu też jest problem!”
Bart Silverstrim,

16

Użyj RAID6. Przeczytaj „Dlaczego RAID 6 przestaje działać w 2019 roku” autorstwa Robina Harrisa w ZDNet.


4
A co po 2019 roku?
Mat

2
@ Mat Cześć od roku, w którym RAID 6 przestaje działać. ;-) To naprawdę powinno być w artykule, ale będziesz musiał przyjrzeć się kodowaniu kasowania , zwykle implementowanemu z nadpróbkowaniem wielomianowym przez GF (256) . Oznacza to, że można zastosować (prawie) arbitralne poziomy redundancji, np. 9 + 3 lub 12 + 4. Główną wadą jest to, że jest nieco droższy obliczeniowo niż RAID 6 lub nawet parzystości RAID 5.
Arne Vogel

9

RAID 5 nigdy nie powinien istnieć z „hot spare”. RAID 6 to zawsze lepsze wykorzystanie tej samej liczby dysków.

http://www.smbitjournal.com/2012/07/hot-spare-or-a-hot-mess/

Rozwiązanie RAID 5 nie ma przewagi przestrzennej / pojemnościowej ani kosztowej (ale ma pewną niewielką przewagę wydajnościową), ale w znacznym stopniu zmniejsza ryzyko, takie jak ryzyko URE.


3
RAID-6 jest znacznie wolniejszy niż RAID-5 + hot spare. RAID-6 nie zawsze jest lepszy.
Stefan Lasiewski

2
RAID-5 (lub w tym przypadku RAID-6) z kołem zapasowym może mieć sens z punktu widzenia liczby dysków, jeśli masz więcej niż jeden pasek, który może współdzielić jeden zapas. Pozwala to na natychmiastowe rozpoczęcie resilveringu w przypadku awarii dysku i natychmiastową wymianę uszkodzonego dysku, ale gdy jest to wygodne , zamiast próbować wymieniać uszkodzony dysk przed wystąpieniem kolejnej awarii.
CVn

2
RAID 6 jest szybszy przy odczycie, wolniejszy przy zapisie. Ale tylko losowo. Sekwencyjnie, jest szybszy w obu przypadkach. Ale różnica w bezpieczeństwie jest imponująca, pełna różnica wielkości. Dodaj pamięć podręczną zapisu, jak każdy sprzęt klasy biznesowej RAID, a losowe zapisy RAID 6 dramatycznie spadną. Bardzo rzadko R6 jest wolniejszy niż R5, ponieważ ma dodatkowe wrzeciono.
Scott Alan Miller

Natychmiastowe resilving jest w rzeczywistości niebezpieczeństwem, ponieważ jest to operacja resilveru, która stawia tablicę w największym niebezpieczeństwie. R6 z hot spare jest zupełnie inny niż R5 z hot spare. R5 z hot spare nigdy nie powinien istnieć, ponieważ używasz tego samego dysku w R6, ale zyskujesz szybkość i niezawodność. Nie ma potrzeby resilveru, ochrona jest już na miejscu bez ryzyka URE działania resilvera.
Scott Alan Miller

6

Ta jest łatwa - jeśli chcesz więcej dostępnego miejsca na dysku lub zdolność do przetrwania dysków ulegających awarii - to takie proste.

Przyjmuję więc kilka dzikich założeń - że nie zależy ci na wydajności, ponieważ są to 7.2, i że dbasz o dostępną przestrzeń, ponieważ są to dyski 1 TB - nie wspominasz, jakiego rodzaju danych chcesz do przechowywania, ale założę, że są to albo pliki wideo, albo kombinacja wideo i audio. Jeśli mam rację, to prawdopodobnie miałbyś problem z zastąpieniem danych? w takim przypadku nie wybrałbym ani 5, ani 6, ale wybrałbym R10, tak, tracisz 1 TB w stosunku do R6 i 2 TB w stosunku do R5, ale będzie to szybsze i może przetrwać trzy dyski pop. Jeśli się mylę i możesz szybko odzyskać swoje dane, możesz również przejść na R5, aby uzyskać jak najwięcej dostępnego miejsca.


1
„Tak, tracisz 1 TB w stosunku do R6 i 2 TB w stosunku do R5, ale będzie to szybsze i może przetrwać trzy dyski pop.” - To jeśli masz szczęście; w najgorszym przypadku nie przeżyjesz więcej niż 1 awarii dysku (jeśli 2. jest w tej samej parze RAID 1 co pierwsza). Jeśli się nie mylę, w przypadku awarii dysków 1, 2, 3 i 4, „naiwne” skumulowane prawdopodobieństwo konieczności skorzystania z kopii zapasowej wynosi odpowiednio 0, 1/5, 3/5, 1 (liczba zero warunki to liczba awarii dysku, które można bezpiecznie tolerować). W przypadku RAID 6 jest to 0, 0, 1, z którym łatwiej jest pracować, a dodatkowo nie tracisz dodatkowego terabajtu.
James Haigh

2
Masz rację, James, rzeczy się zmieniły w ciągu ostatnich PIĘCIU LAT (OMG dawno temu - wow!), A teraz polecam tylko R6 / 60 i R1 / 10.
Chopper3

4

Wydajność jest problemem, ale nie jest tak ważna, jak myślisz. Nowszy sprzęt RAID będzie tak szybko zapisywał 2 paski parzystości, jak na 1 pasku.

Ponadto dyski SAS mają zwykle niższy współczynnik błędu bitowego, co przekłada się na niższy poziom nieodwracalnego błędu odczytu (URE). Zwykle rząd wielkości (10x), jednak jeśli dysk SAS jest tego samego modelu co dysk SATA, poprawa może nie być widoczna.

Wreszcie, jeśli chodzi o kwestię RAID-5 i URE oraz tego, jak może to zrujnować twój dzień, napisałem o tym jakiś czas temu na stronie: http://subnetmask255x4.wordpress.com/2008/10/28/sata- unrecoverable-error-and-how-that-impacts-raid / w którym omawiam niektóre z tych pytań. Zasadniczo RAID-6 na dobrym sprzęcie (nie programowym RAID) powinien wykazywać wydajność równoważną do RAID-5. Jeśli masz słaby sprzęt lub używasz programowego RAID, zobaczysz spadek wydajności.

Jak zawsze kopie zapasowe są twoją zaletą. Nie zapomnij wdrożyć zasady tworzenia kopii zapasowych ORAZ sprawdź, czy można ją odzyskać.


2
Wow, myślę, że byłem z tym wszystkim do cholery. Próbowałem powiedzieć, że biorąc pod uwagę dyski, jeśli masz dobry sprzętowy kontroler RAID, wówczas RAID 6 nie ma wad w stosunku do RAID 5 z gorącym zapasem (+1). Jeśli jednak nie masz dobrego kontrolera sprzętowego RAID, zobaczysz wolniejsze odczyty i zapisy, a zapisy będą nieco wolniejsze niż odczyty. Jeśli używasz tylko programowego RAID, zobaczysz wolniejszy odczyt i dużo wolniejsze zapisywanie. Dobry sprzęt - RAID 6; Słaby sprzęt - RAID 6 z obniżeniem wydajności; Tylko oprogramowanie - RAID 5 (+1) i módlcie się bardzo.

3

Wiele dobrych rad tutaj, szczególnie od Barta i Choppera3.

Jedyne, co chciałbym dodać, to przetestować obciążenie pracą w warunkach awarii. Ludzie zwykle konfigurują RAID-5 / RAID-6, aby kupić dostępność (tzn. Serwer nie przestaje działać z powodu awarii dysku). Niestety, w przypadku niektórych obciążeń - szczególnie obciążeń obciążających zapis, może się okazać, że wydajność jest na tyle duża, że ​​nie kupujesz dużo.

Jeśli testowanie się powiedzie, świetnie - po prostu nie zapomnij o opracowaniu i przetestowaniu strategii tworzenia kopii zapasowych.


2

Myślę, że RAID 5 vs. 6 (i vs. 10) sprowadza się do wydajności i tego, jak bardzo ufasz marce (markom) używanych dysków. Korzystamy głównie z serwerów HP i pamięci masowej HP i mieliśmy bardzo mało awarii dysków, więc cieszę się z RAID5 + hotspare lub nawet tylko RAID5 w mniej krytycznych systemach.

Teoretycznie RAID6 ratuje Cię przed awarią drugiego dysku podczas odbudowy pierwszego uszkodzonego dysku, ale wymieniasz to na zwiększone obliczenia potrzebne do wygenerowania 2 różnych pasów parzystości. Nie użyliśmy 6, więc nigdy nie przyjrzałem się żadnym specyfikacjom dotyczącym tego, jak szybko macierz RAID6 może zostać odbudowana w porównaniu z RAID5, ale zakładam, że 6 zajmie więcej czasu, ponieważ musi wykonać 2 obliczenia parzystości, nie tylko jedną.

Gdybym miał odejść od RAID5, prawdopodobnie wybrałbym 10 (lub 01), aby całkowicie uniknąć obliczeń parzystości. Z 6 dyskami możesz to zrobić, chociaż uzyskujesz tylko połowę pojemności.


2

RAID6. W ten sposób, jeśli dwa dyski ulegną awarii w stosunkowo krótkim czasie, a więc tablica nie zakończyła odbudowy od pierwszej awarii (lub 2 dyski nie zostaną uruchomione po awarii zasilania), nie stracisz wszystkich danych.


1

Raid6 ma więcej narzutu, więc raid5 jako taki będzie szybszy na tej samej liczbie dysków. Z drugiej strony możesz stracić przewagę, gdy dysk zginie, a rai5 przebuduje się, istnieje ryzyko utraty macierzy, jeśli podczas przebudowy zginą inne dyski.

W twoim przypadku używasz raid5 vs 6 na innej liczbie wrzecion, więc z powodu dodatkowego wrzeciona raid6 może być szybszy.


1

Dobre odpowiedzi, z wyjątkiem tego, że nikt nie wspomniał o wydajności zapisu. RAID 6 zwykle powoduje niewielki spadek wydajności podczas zapisu w porównaniu do RAID 5, ponieważ należy zachować dwa paski parzystości.

Niemniej jednak większość uważa, że ​​warto skorzystać z RAID 6.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.