Jak wyszukiwać w plikach PDF za pomocą wyrażeń regularnych?


15

Zwykle używam Notepad ++ do wyszukiwania w plikach za pomocą wyrażeń regularnych. Dzisiaj zastanawiam się, czy istnieje program PDF, który robi to samo w przypadku plików PDF. Oczywiście mogę przekonwertować plik PDF na tekst i korzystać z Notepad ++, ale czy jest łatwiejszy sposób bez konwersji?


1
Z jakiego systemu operacyjnego korzystasz?
Scott McClenning

Windows Developer Preview i Windows 7
Michael S.

Odpowiedzi:



4
  1. Agent Ransack jest darmowy (Lite) i obsługuje PDF, jak potwierdzają informacje o wydaniu.
  2. PowerGREP jest produktem komercyjnym.

Tak jak powiedziałeś, oczywistą alternatywą jest konwersja plików PDF na tekst. Jednym ze sposobów programisty na skonfigurowanie tego do masowego przetwarzania jest użycie pakietu PDFMiner w Pythonie. Agent Ransack używa „pdftotext” z projektu Xpdf (i ty też możesz).


sidenote: Agent Ransack to lite wersja FileLocator
akira

Dzięki! Spojrzałem uważniej. Informacje o wersji dostawcy potwierdzają, że File Locator Lite aka Agent Ransack obsługuje pliki PDF. Edycja mojej odpowiedzi.
minopret

Agent Ransack wykonuje to zadanie. Możesz także wypróbować DnGrep.
Michael S.
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.