Próbujesz przekonwertować plik PDF na tekst za darmo


11

Używam OSX i chciałbym móc konwertować pliki pdf na tekst.

Chciałbym, aby to zrobiła darmowa aplikacja, ponieważ jestem pewien, że muszą być jakieś.


2
Chcesz wyodrębnić tekst z plików PDF, które już zawierają tekst? (tj. możesz kopiować i wklejać fragmenty z nich) Czy chcesz rozpoznać tekst w treści obrazu?
Alan Shutko

Robi free-ocr.com Wsparcie?
Tim

Odpowiedzi:


10

Na prośbę Patrix, oto kroki, których użyłem do zainstalowania i używania xpdf przez Homebrew:

/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"

Zrób to, co każe ukończyć instalację Homebrew, a następnie wykonaj:

brew install Caskroom/cask/xquartz

brew install xpdf

pdftotext 98789_LogiqueAnalyse_232_08.pdf 98789_LogiqueAnalyse_232_08.txt

Pierwszą nazwą pliku był istniejący plik PDF; drugi to cel. Wyniki były znacznie lepsze niż w (co prawda starej) wersji Adobe Acrobat.


2
Myślę że xquartz nie jest potrzebny dla narzędzi konsoli w xpdf. Ponadto istnieje poppler widelec xpdf co wydaje się znacznie bardziej aktywne: github.com/scraperwiki/scraperwiki-python/issues/…
Jeroen Wiert Pluimers

4

Wiele metod.

  1. Posługiwać się Dokumenty Google (potrzebujesz konta Google)

  2. Posługiwać się Automator (wymagana praca)

Za pomocą Automatora można utworzyć przepływ pracy, który może wyodrębnić tekst   Pliki PDF i zapisz je jako tekst lub dokument RTF.

extract text from pdf

lub aplikacja z App Store, np. PDF do tekstu


4

Aktualna wersja Adobe Reader (11.0.09) ma element „Zapisz jako inny” w menu Plik.

Jedną z opcji jest Tekst .

Aplikacja jest darmowa i wykonuje przyzwoitą pracę, generując pliki tekstowe. Wszystkie obrazy w nowym dokumencie zostaną utracone w formacie .txt.


2

xpdf które zainstalowałem z portami:

port install xpdf

zawiera:

xpdf-pdftotext

Robi to, co chcesz dla każdego pliku PDF pochodzącego z plik tekstowy (a nie z obrazu):

xpdf-pdftotext PDF_file text_file

1
Polecenie, przynajmniej zainstalowane przez HomeBrew, jest po prostu „pdftotext”.
Flash Sheridan

@Fashashheridan Czy mogę zachęcić Cię do wysłania odpowiedzi dotyczącej „pdftotext” i sposobu instalacji za pomocą homebrew? Komentarze mogą zostać usunięte w dowolnym momencie (a także nie pojawiają się w wyszukiwaniach).
nohillside

0

Myślę, że powinieneś móc kopiować i wklejać tekst do innego dokumentu. Aby zaznaczyć cały tekst

Otwórz plik PDF w „Podgląd” i

  • wybierz „Edytuj | Wybierz wszystko”
  • wybierz „Edytuj | Kopiuj”

Przejdź do innej aplikacji, powiedz „Edycja tekstu”

  • wybierz „Edytuj | Wklej”

Pamiętaj, że jeśli spróbujesz to zrobić, a nie ma wklejonego tekstu, tylko kilka pustych wierszy, spróbuj najpierw wydrukować plik PDF do nowego pliku PDF, np.

  • W Podglądzie wybierz „Plik | Drukuj”
  • W prawym dolnym rogu wybierz „PDF | Zapisz jako PDF”
  • Eksportuje nowy plik PDF.

Teraz wypróbuj powyższy proces z tym nowym plikiem PDF. Pracowałem dla mnie!


1
Chociaż powinno to działać, gdy dokument PDF rzeczywiście zawiera tekst zawartość, nie zachowuje formatowania, aw niektórych przypadkach tworzy tekst śmieci wraz z tekstem, który zostałby uznany za pożądany. Zauważ, że może to być również to samo z innymi metodami, ale uważam, że ważne jest, aby zwrócić uwagę.
user3439894

bez wątpienia - na pewno nie jest idealny i całkowicie zgadzam się ze wszystkim, co powiedziałeś. Dodałem go tutaj tylko jako opcję, którą wcześniej zauważyłem, która działała dla mnie bez instalowania czegokolwiek ;-)
Brad Parks
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.