Jestem doktorantem, a grupa, w której pracuję, utrzymuje klaster Linux. Każdy węzeł klastra ma własny dysk lokalny, ale dyski lokalne są stosunkowo małe i nie są wyposażone w automatyczne tworzenie kopii zapasowych. Tak więc grupa posiada serwer plików z wieloma TB przestrzeni dyskowej. Jestem względnym nowicjuszem w systemie Linux, więc nie jestem pewien, jakie są specyfikacje serwera plików pod względem szybkości, możliwości pracy w sieci itp. Z doświadczenia wiem, że dyski lokalne są znacznie szybsze niż serwer plików pod względem operacji we / wy . Z serwera plików korzysta około tuzina osób.
Korzystanie cpskopiować ~ 20 GB plik z serwera plików do jednej z lokalnych dysków trwa około 11,5 minuty w czasie rzeczywistym na średni (zgodnie time). Wiem, że ta cpoperacja nie jest bardzo wydajna, ponieważ (1) timemówi mi, że czas systemowy dla takiej kopii wynosi tylko ~ 45 sekund; a ponieważ (2) podczas sprawdzania toppodczas kopiowania % procesora jest dość niski (według kontroli średnio około 0-10% ).
Korzystanie cpskopiowanie tego samego ~ 20 PL plik z jednym katalogu na dysku lokalnego na inny katalogu na tym samym dysku lokalnego zajmuje mniej czasu - około 9 minut, w czasie rzeczywistym (~ 51 sekund, w czasie, w zależności od systemu time). Najwyraźniej serwer plików jest zgodnie z oczekiwaniami nieco wolniejszy niż dysk lokalny, ale być może nie jest znacznie wolniejszy. Dziwi mnie, że kopiowanie z lokalnego na ten sam lokalny nie trwa krócej niż 9 minut.
Muszę skopiować ~ 200 dużych plików - każdy ~ 20 GB - z serwera plików na jeden z dysków lokalnych. Moje pytanie brzmi: czy istnieje szybsza alternatywa cpdla kopiowania dużych plików w systemie Linux? (Czy są też jakieś flagi, cpktóre mogłyby użyć, które przyspieszyłyby kopiowanie?) Nawet gdybym mógł jakoś skrócić minutę kopiowania, to ogromnie by to pomogło.
Jestem pewien, że kupuję nowe, szybsze dyski sprzętowe, ale nie mam dostępu do takich zasobów. Nie jestem także administratorem systemu - jestem tylko (początkującym) użytkownikiem - więc nie mam dostępu do bardziej szczegółowych informacji na temat obciążenia na dyskach. Wiem, że chociaż kilkanaście osób korzysta z serwera plików codziennie, jestem jedyną osobą używającą tego konkretnego węzła / dysku lokalnego.
ddi rsyncporównać, który z nich działa szybciej w środowisku
dd, ale próbowałem rsync. Według czasu rzeczywistego czas wyniósł około 11,5 minuty, a czas systemowy - około 1,5 minuty time.
/dev/sda1do /dev/sdb1będzie szybsze niż kopiowanie z jednej lokalizacji /dev/sda1do innej lokalizacji na /dev/sda1lub innej partycji na, /dev/sdaponieważ dysk twardy nie będzie musiał wykonywać dodatkowych operacji wyszukiwania i odczytu (zakładając, że tradycyjne dyski twarde mają obracające się dyski i ruchome głowy; SSD jest oczywiście inny).