Przegląd
Co szukasz są narzędzia, takie jak skanowanie Tailor i unpaper które są zdolne obcinanie , despeckling i usuwanie szumu . Oba narzędzia działają raczej z obrazami niż z plikami PDF, ale można łatwo konwertować między różnymi formatami używanymi przez te aplikacje i plikami PDF za pomocą narzędzi opisanych na końcu tej odpowiedzi.
ScanTailor
Samouczek wideo można znaleźć tutaj . Bardziej obszerna dokumentacja jest dostępna na oficjalnej wiki . Prawdopodobnie najbardziej zainteresuje Cię strona dotycząca trybu wydruku czarno-białego i ustawień filtrów .
Papier
Jeszcze ze unpaper
sobą nie pracowałem . Z tego, co rozumiem, ma znacznie więcej funkcji niż ScanTailor, ale jest również o wiele trudniejszy do opanowania.
Nie ma interfejsu GUI i będziesz musiał polegać na przełącznikach wiersza poleceń, aby wykonać swoją pracę. Z drugiej strony oznacza to, że konwersje unpaper
można łatwo zautomatyzować za pomocą skryptów.
Można znaleźć kilka przykładów skryptów dotyczących konwersji skanowanie do czerni i bieli oraz usuwanie tła tutaj .
Kilka pomocnych narzędzi podczas pracy z aplikacją Unpaper i ScanTailer
Nie mam wystarczająco dużo czasu, aby napisać pełny samouczek na temat ScanTailor i unpaper¹, ale oto kilka wskazówek dotyczących konwersji między .pdf
formatami obrazów obsługiwanymi przez te narzędzia:
Możesz użyć pdfimages
do konwersji dokumentów PDF na .ppm
pliki jednostronicowe , które można odczytać unpaper
.
Przykład użycia:
pdfimages *.pdf ./extracted-images
ScanTailor nie przyjmuje .ppm
plików jako danych wejściowych. .png
Najpierw będziesz musiał przekonwertować je na inny format, taki jak bezstratny . mogrify
z imagemagick
pakietu narzędzi może to zrobić za Ciebie.
Przykład użycia:
mogrify -format png *.ppm
Format wyjściowy ScanTailor i niepapierowane są .tiff
plikami pojedynczych stron . Aby przekonwertować je z powrotem na .pdf
, sugerowałbym użycie tiffcp
i tiff2pdf
.
Przykład użycia:
tiffcp *.tiff all.tiff
tiff2pdf -F -p A4 -z -o Document.pdf all.tiff
Instalacja
To polecenie zainstaluje wszystkie wyżej wymienione narzędzia:
sudo apt-get install scantailor unpaper poppler-utils libtiff-tools
¹: Dla każdego, kto to czyta, prosimy o opracowanie obszerniejszej odpowiedzi na podstawie ScanTailor i / lub papieru.