Opcje szybkiego dostępu i tworzenia kopii zapasowych milionów plików
Pożycz od osób z podobnymi problemami
To brzmi bardzo podobnie do łatwiejszego problemu, z którym borykają się serwery wiadomości USENET i buforowanie serwerów proxy: setki milionów małych plików, do których dostęp jest losowy. Możesz wziąć od nich podpowiedź (z tym, że zazwyczaj nie muszą oni robić kopii zapasowych).
http://devel.squid-cache.org/coss/coss-notes.txt
http://citeseer.ist.psu.edu/viewdoc/download;jsessionid=4074B50D266E72C69D6D35FEDCBBA83D?doi=10.1.1.31.4000&rep=rep1&type=pdf
Oczywiście cykliczny charakter systemu plików wiadomości cyklicznych jest dla ciebie nieistotny, ale koncepcja niższego poziomu posiadania wielu plików / urządzeń dyskowych z zapakowanymi obrazami i szybkiego indeksu z informacji dostarczonych przez użytkownika w celu wyszukiwania informacji o lokalizacji jest bardzo odpowiednia.
Dedykowane systemy plików
Oczywiście są to tylko podobne pojęcia do tego, o czym rozmawiali ludzie, tworząc system plików w pliku i montując go w pętli zwrotnej, tyle że można napisać własny kod systemu plików. Oczywiście, ponieważ powiedziałeś, że twój system jest w większości do odczytu, możesz tak naprawdę dedykować partycję dyskową (lub partycję lvm dla elastyczności w doborze) do tego jednego celu. Aby utworzyć kopię zapasową, zamontuj system plików tylko do odczytu, a następnie wykonaj kopię bitów partycji.
LVM
Wspomniałem LVM powyżej jako przydatne do dynamicznego określania rozmiaru partycji, dzięki czemu nie trzeba tworzyć kopii zapasowej dużej ilości pustego miejsca. Ale oczywiście LVM ma inne funkcje, które mogą być bardzo przydatne. W szczególności funkcja „migawki”, która pozwala chwilowo zamrozić system plików. Przypadkowe rm -rf
lub cokolwiek innego nie zakłóciłoby migawki. W zależności od tego, co dokładnie próbujesz zrobić, może to być wystarczające dla potrzeb tworzenia kopii zapasowych.
RAID-1
Jestem pewien, że znasz już macierz RAID i prawdopodobnie już używasz jej w celu zapewnienia niezawodności, ale RAID-1 może być również używany do tworzenia kopii zapasowych, przynajmniej jeśli używasz programowego RAID (możesz go używać ze sprzętowym RAID, ale tak naprawdę daje niższą niezawodność, ponieważ może wymagać odczytu tego samego modelu / kontrolera wersji). Koncepcja polega na tym, że tworzysz grupę RAID-1 z jednym dyskiem więcej, niż potrzebujesz do podłączenia do normalnych potrzeb w zakresie niezawodności (np. Trzeci dysk, jeśli używasz programowego RAID-1 z dwoma dyskami lub być może dużym dyskiem i sprzętem- RAID5 z mniejszymi dyskami z programowym RAID-1 na sprzętowym RAID-5). Kiedy przyjdzie czas na wykonanie kopii zapasowej, zainstaluj dysk, poproś mdadm o dodanie tego dysku do grupy RAID, poczekaj, aż wskaże on kompletność, opcjonalnie poproś o weryfikację, a następnie usuń dysk. Oczywiście,