Pytania otagowane jako text-extraction



15
Jak wyodrębnić tekst z pliku PDF? [Zamknięte]
Zamknięte. To pytanie nie spełnia wytycznych dotyczących przepełnienia stosu . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było na temat przepełnienia stosu. Zamknięte 5 lat temu . Popraw to pytanie Czy ktoś może polecić bibliotekę / API do wyodrębniania tekstu i obrazów z pliku PDF? Musimy …

8
Jak wyodrębnić ciąg następujący po wzorcu za pomocą grep, regex lub perl
Mam plik, który wygląda mniej więcej tak: <table name="content_analyzer" primary-key="id"> <type="global" /> </table> <table name="content_analyzer2" primary-key="id"> <type="global" /> </table> <table name="content_analyzer_items" primary-key="id"> <type="global" /> </table> I trzeba wyodrębnić coś wewnątrz cudzysłowów, które następują name=, to znaczy content_analyzer, content_analyzer2i content_analyzer_items. Robię to na Linuksie, więc rozwiązanie wykorzystujące sed, perl, grep lub …

5
Wyodrębnianie tekstu z pliku PDF za pomocą PDFMiner w Pythonie?
Szukam dokumentacji lub przykładów, jak wyodrębnić tekst z pliku PDF za pomocą PDFMiner z Pythonem. Wygląda na to, że PDFMiner zaktualizował swoje API, a wszystkie odpowiednie przykłady, które znalazłem, zawierają przestarzały kod (klasy i metody uległy zmianie). Biblioteki, które znalazłem, które ułatwiają wyodrębnianie tekstu z pliku PDF, używają starej składni …

2
Analiza PDF w Pythonie - wyodrębnianie sformatowanych i zwykłych tekstów [zamknięte]
Zamknięte. To pytanie nie spełnia wytycznych dotyczących przepełnienia stosu . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było na temat przepełnienia stosu. Zamknięte 5 lat temu . Popraw to pytanie Szukam biblioteki PDF, która pozwoli mi wyodrębnić tekst z dokumentu PDF. Spojrzałem na PyPDF i to …
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.