Linux - polecenie usuwania obrazów z pdf


0

Mam plik pdf, który jest ogromny, ponieważ został wyeksportowany z Photoshopa i prawie nie mogę go otworzyć. Zawiera tekst, lubię kopiować / wklejać.

Czy istnieje polecenie usunięcia wszystkich obrazów z pliku pdf i zapisania wyniku jako nowego pliku?

Btw. Próbowałem już pdftotext, ale wynikowy plik jest zawalony, linia podzielona na maksymalnie 10 znaków, cała spacja i tak dalej.

AKTUALIZACJA

Znalazłem tu fajny wątek , ale żadne z rozwiązań nie zadziałało, więc myślę, że »photoshop pdf« jest naprawdę źle…

Odpowiedzi:


1

W zależności od tekstu, który chcesz wyodrębnić, może być lepiej uruchomić na nim pdf2txt .


tak lepiej, ale wciąż są w nim jakieś dziwne rzeczy, chyba kilka sekwencji ucieczki, takich jak: Di(cid:249)erentw tym… Ale dzięki za odpowiedź!
philipp
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.