Edytuj 2015
od wersji ut-linux 2.25 fallocate
narzędzie w Linuksie ma do tego opcję -d
/ --dig-hole
.
fallocate -d the-file
Wykopałby dziurę dla każdego bloku pełnego zer w pliku
W starszych systemach możesz to zrobić ręcznie:
Linux ma taką FALLOC_FL_PUNCH_HOLE
opcję fallocate
. Znalazłem skrypt na githubie z przykładem:
Używanie FALLOC_FL_PUNCH_HOLE z Python
Zmodyfikowałem go trochę, aby zrobić to, o co prosiłeś - dziurawić dziury w obszarach plików wypełnionych zerami. Oto on:
Używanie FALLOC_FL_PUNCH_HOLE z Pythona do wybijania dziur w plikach
usage: punch.py [-h] [-v VERBOSE] FILE [FILE ...]
Punch out the empty areas in a file, making it sparse
positional arguments:
FILE file(s) to modify in-place
optional arguments:
-h, --help show this help message and exit
-v VERBOSE, --verbose VERBOSE
be verbose
Przykład:
# create a file with some data, a hole, and some more data
$ dd if=/dev/urandom of=test1 bs=4096 count=1 seek=0
$ dd if=/dev/urandom of=test1 bs=4096 count=1 seek=2
# see that it has holes
$ du --block-size=1 --apparent-size test1
12288 test1
$ du --block-size=1 test1
8192 test1
# copy it, ignoring the hole
$ cat test1 > test2
$ du --block-size=1 --apparent-size test2
12288 test2
$ du --block-size=1 test2
12288 test2
# punch holes again
$ ./punch.py test2
$ du --block-size=1 --apparent-size test2
12288 test2
$ du --block-size=1 test2
8192 test2
# verify
$ cmp test1 test2 && echo "files are the same"
files are the same
Zauważ, że punch.py
wyszukuje tylko bloki 4096 bajtów do wybicia, więc może nie tworzyć pliku tak rzadkiego, jak w momencie uruchamiania. Oczywiście może być mądrzejszy. Ponadto jest tylko lekko przetestowany , więc bądź ostrożny i wykonaj kopie zapasowe, zanim mu zaufasz!