Mam komputer z procesorem Intel® Pentium® G640 @ 2,80 GHz i 8 GB pamięci RAM. Używam na nim Scientific Linux 6.5 z systemem plików EXT3.
W tej konfiguracji, jaki jest najszybszy sposób sort -u
na wykonanie pliku o pojemności 200 gigabajtów?
Czy powinienem podzielić plik na mniejsze pliki (mniejsze niż 8 GB), sort -u
złożyć je razem, a następnie ponownie podzielić na inny rozmiar sort -u
itp.? A może istnieją jakieś skrypty sortujące, programy, które mogłyby obsługiwać tak duże pliki przy mojej ograniczonej ilości pamięci RAM?
parallel
Myślę, że będziesz potrzebować GNU do tego, a nie moreutils, parallel
który jest domyślnie instalowany w niektórych systemach.
sort(1)
może zabraknąć miejsca na /tmp
; jeśli tak, możesz wyznaczyć inny obszar dla plików tymczasowych ze zmienną środowiskową TMPDIR
lub flagą-T=<tmpdir>
/tmp
.