Jestem doktorantem, a grupa, w której pracuję, utrzymuje klaster Linux. Każdy węzeł klastra ma własny dysk lokalny, ale dyski lokalne są stosunkowo małe i nie są wyposażone w automatyczne tworzenie kopii zapasowych. Tak więc grupa posiada serwer plików z wieloma TB przestrzeni dyskowej. Jestem względnym nowicjuszem w systemie Linux, więc nie jestem pewien, jakie są specyfikacje serwera plików pod względem szybkości, możliwości pracy w sieci itp. Z doświadczenia wiem, że dyski lokalne są znacznie szybsze niż serwer plików pod względem operacji we / wy . Z serwera plików korzysta około tuzina osób.
Korzystanie cp
skopiować ~ 20 GB plik z serwera plików do jednej z lokalnych dysków trwa około 11,5 minuty w czasie rzeczywistym na średni (zgodnie time
). Wiem, że ta cp
operacja nie jest bardzo wydajna, ponieważ (1) time
mówi mi, że czas systemowy dla takiej kopii wynosi tylko ~ 45 sekund; a ponieważ (2) podczas sprawdzania top
podczas kopiowania % procesora jest dość niski (według kontroli średnio około 0-10% ).
Korzystanie cp
skopiowanie tego samego ~ 20 PL plik z jednym katalogu na dysku lokalnego na inny katalogu na tym samym dysku lokalnego zajmuje mniej czasu - około 9 minut, w czasie rzeczywistym (~ 51 sekund, w czasie, w zależności od systemu time
). Najwyraźniej serwer plików jest zgodnie z oczekiwaniami nieco wolniejszy niż dysk lokalny, ale być może nie jest znacznie wolniejszy. Dziwi mnie, że kopiowanie z lokalnego na ten sam lokalny nie trwa krócej niż 9 minut.
Muszę skopiować ~ 200 dużych plików - każdy ~ 20 GB - z serwera plików na jeden z dysków lokalnych. Moje pytanie brzmi: czy istnieje szybsza alternatywa cp
dla kopiowania dużych plików w systemie Linux? (Czy są też jakieś flagi, cp
które mogłyby użyć, które przyspieszyłyby kopiowanie?) Nawet gdybym mógł jakoś skrócić minutę kopiowania, to ogromnie by to pomogło.
Jestem pewien, że kupuję nowe, szybsze dyski sprzętowe, ale nie mam dostępu do takich zasobów. Nie jestem także administratorem systemu - jestem tylko (początkującym) użytkownikiem - więc nie mam dostępu do bardziej szczegółowych informacji na temat obciążenia na dyskach. Wiem, że chociaż kilkanaście osób korzysta z serwera plików codziennie, jestem jedyną osobą używającą tego konkretnego węzła / dysku lokalnego.
dd
i rsync
porównać, który z nich działa szybciej w środowisku
dd
, ale próbowałem rsync
. Według czasu rzeczywistego czas wyniósł około 11,5 minuty, a czas systemowy - około 1,5 minuty time
.
/dev/sda1
do /dev/sdb1
będzie szybsze niż kopiowanie z jednej lokalizacji /dev/sda1
do innej lokalizacji na /dev/sda1
lub innej partycji na, /dev/sda
ponieważ dysk twardy nie będzie musiał wykonywać dodatkowych operacji wyszukiwania i odczytu (zakładając, że tradycyjne dyski twarde mają obracające się dyski i ruchome głowy; SSD jest oczywiście inny).