W systemie Linux - jak wyodrębnić tekst, .pdf
w którym tekst to tak naprawdę tekst, a nie skanowany obraz? Chcę czegoś, czego mogę używać w wierszu poleceń / w skrypcie, a nie interaktywnie. (Nie chcę konwertować .tif
i używać OCR - tekst jest już dostępny w .pdf
pliku, więc po co wprowadzać niedokładności z niedoskonałego OCR?)