Mam 4 porcje moosefs z 8 2,7 TB miejsca na każdym, montuję je za pomocą mfsmount, a następnie eksportuję za pomocą nfs. Niedawno zauważyłem wysoki poziom iowait na moich porcjach, a następnie ogromne spadki wielkości montażu, patrz wykresy.
Mam 4 porcje moosefs z 8 2,7 TB miejsca na każdym, montuję je za pomocą mfsmount, a następnie eksportuję za pomocą nfs. Niedawno zauważyłem wysoki poziom iowait na moich porcjach, a następnie ogromne spadki wielkości montażu, patrz wykresy.
Odpowiedzi:
Przyczyną tego problemu była pamięć RAM na serwerze mfs, zaczął używać 50% wymiany, kiedy zwiększyłem pamięć RAM, wszystko zaczęło działać zgodnie z oczekiwaniami, ale nadal istnieje duża iowait na serwerze porcji, myślę, że powinniśmy się przenieść Jod do jakiegoś nalotu.
O stronie JBOD moosefs.com napisano w następujący sposób (w „Najlepsze praktyki”): ( https://moosefs.com/documentation/best-practices.html#jbod )
JBOD i XFS dla Chunkservers
Zalecamy połączenie z JBOD Chunkserver (s). Po prostu sformatuj dysk jako XFS i podłącz np.
/mnt/chunk01, /mnt/chunk02, ...
I włóż te ścieżki/etc/mfs/mfschunkserver.cfg
. To wszystko.Zalecamy taką konfigurację głównie z dwóch powodów:
MooseFS ma mechanizm sprawdzania, czy dysk twardy jest w dobrym stanie, czy nie. MooseFS może wykrywać uszkodzone dyski, replikować dane i oznaczać takie dyski jako uszkodzone. W przypadku macierzy RAID sytuacja wygląda inaczej: algorytmy MooseFS nie działają z macierzami RAID, dlatego uszkodzone macierze RAID mogą być fałszywie zgłaszane jako zdrowe / prawidłowe.
Drugim aspektem jest czas replikacji. Załóżmy, że masz ustawiony cel na 2 dla całej instancji MooseFS. Jeśli jeden dysk 2 TiB ulegnie awarii, replikacja (z innej kopii) potrwa około 40–60 minut. Jeśli jedna duża macierz RAID (np. 36 TiB) ulegnie uszkodzeniu, replikacja może trwać nawet przez 12-18 godzin. Do czasu zakończenia procesu replikacji niektóre dane są zagrożone, ponieważ masz tylko jedną prawidłową kopię. Jeśli inny dysk lub macierz RAID ulegnie awarii w tym czasie, niektóre dane mogą zostać nieodwracalnie utracone. Dłuższy okres replikacji naraża Twoje dane na większe niebezpieczeństwo.