Mam komputer z procesorem Intel® Pentium® G640 @ 2,80 GHz i 8 GB pamięci RAM. Używam na nim Scientific Linux 6.5 z systemem plików EXT3.
W tej konfiguracji, jaki jest najszybszy sposób sort -una wykonanie pliku o pojemności 200 gigabajtów?
Czy powinienem podzielić plik na mniejsze pliki (mniejsze niż 8 GB), sort -uzłożyć je razem, a następnie ponownie podzielić na inny rozmiar sort -uitp.? A może istnieją jakieś skrypty sortujące, programy, które mogłyby obsługiwać tak duże pliki przy mojej ograniczonej ilości pamięci RAM?
parallelMyślę, że będziesz potrzebować GNU do tego, a nie moreutils, parallelktóry jest domyślnie instalowany w niektórych systemach.
sort(1)może zabraknąć miejsca na /tmp; jeśli tak, możesz wyznaczyć inny obszar dla plików tymczasowych ze zmienną środowiskową TMPDIRlub flagą-T=<tmpdir>
/tmp.