Jak wyodrębnić tekst z pliku PDF, który nie został zbudowany za pomocą indeksu? Cały tekst, ale nie mogę niczego wyszukiwać ani wybierać. Używam Kubuntu, a Okular nie ma tej funkcji.
Dzisiaj otrzymałem plik PDF od naszego dostawcy, który zawierał kilka wydrukowanych i zeskanowanych stron z podpisami itp. Otworzyłem go w programie Acrobat Reader DC. Ku mojemu zdziwieniu tekst z wyraźnie zeskanowanych obrazów mógł zostać wybrany i skopiowany jako tekst. Zobacz zrzut ekranu: Najwyraźniej kryje się za tym OCR, ponieważ kopiowany …
To zostało omówione rok temu tutaj: Batch OCR dla wielu plików PDF (jeszcze nie OCRed)? Czy jest jakiś sposób na grupowanie plików PDF OCR, które nie zostały jeszcze OCRedowane? Myślę, że jest to obecny stan rzeczy dotyczących dwóch zagadnień: Partie plików PDF OCR Windows Acrobat - jest to najprostszy silnik …
Zamknięte. To pytanie jest nie na temat . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizować pytanie , dlatego na temat Super Użytkownika. Zamknięte 4 lata temu . Mam plik PDF zeskanowanej książki. Szukam darmowego oprogramowania, które wykona OCR, a następnie zapewni opcję zapisania go ponownie jako plik PDF …
Zamknięte. To pytanie jest nie na temat . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizować pytanie , dlatego na temat Super Użytkownika. Zamknięte 4 lata temu . Wiele razy natrafiłem na mapy bitowe zawierające wyłącznie akapity tekstowe, więc szukałem sposobu na identyfikację użytej czcionki, wyrównanie akapitu, odstępy między …
Evernote wykonuje OCR na zapisywanych do niego obrazach. Czy istnieje sposób, aby uzyskać ekwiwalent pełnego tekstu dla obrazu w Evernote, czy OCR służy tylko do wyszukiwania?
Byłem w pobliżu miejsca mojego dziadka w ostatni weekend. Moja babcia wyciągnęła tę gigantyczną (około 1400 stron) książkę z historii swojej rodziny sięgającą 1630 roku. Gigantyczny nerd, którym jestem, pomyślałem, że byłoby fajnie mieć wszystkie informacje przechowywane w bazie danych i dostępne w Internecie. Potrafię obsłużyć wszystkie programy internetowe i …
Od jakiegoś czasu szukam Google, ale nie mogę znaleźć odpowiedzi na moje pytanie. Mam niechciane warstwy OCR w dokumencie, który ostatnio skanowałem za pomocą Adobe Acrobat. Nie został poprawnie rozpoznany, a ja chcę zmienić niektóre informacje, ale OCR sprawia, że poszukiwane informacje zostają usunięte. Przekształciłem pliki na TIF, ale zauważyłem …
Ten plik PDF został stworzony przez Abbyy Finereader 10: http://ebooks.zeitr.org/from_abbyy.pdf Możesz skopiować i wkleić pierwsze zdanie i uzyskać ten (bardzo dobry) wynik tekstowy: Der »Bund Deutscher Gymnastik-Schulleiter« wurde am 20 listopada 1955 anläßlich einer Zusammenkunft der Leiterinnen und Leiter der privaten deutschen Gymnastik-Ausbildungsstätten gegründet. Po przetworzeniu za pomocą Ghostscript 9.02 …
Zamknięte. To pytanie jest nie na temat . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizować pytanie , dlatego na temat Super Użytkownika. Zamknięte 5 lat temu . Korzystam z Google Desktop Search (korzystam z systemu Vista) i nie wszystkie moje pliki PDF są rozpoznawane w folderze archiwum. Jest …
Użyłem SimpleOCR , który ma ładny GUI do poprawiania błędów. Niestety popełnia wiele błędów! (i cierpi na inne błędy i ograniczenia) Z drugiej strony Tesseract jest dokładniejszy, ale w ogóle nie ma GUI. Moje pytanie brzmi: czy istnieje bezpłatny program OCR dla systemu Windows, który ma ładny interfejs GUI i …
Przetwarzanie OCR zajmuje dużo czasu. Korzystanie z wielu rdzeni procesora przyspieszy przetwarzanie. Acrobat 10 nie był aplikacją wielowątkową . Co powiesz na Acrobat 11? Czy 11 domyślnie robi OCR przy użyciu wielu rdzeni procesora (jeśli są dostępne)? Jeśli nie, czy istnieją jakieś obejścia, np. Skrypty, które pomagają programowi Acrobat 11 …
Jak rozpocząć skanowanie i rozpoznawanie znaków za pomocą Microsoft Office Word 2010 (Beta)? Nie mogę znaleźć opcji skanowania dokumentu w skanerze bezpośrednio do dokumentu Word 2010. Sprawdziłem ustawienia instalacji pakietu Office 2010 (Beta) i elementy OCR zostały zainstalowane.
Zeskanowałem książkę w formacie PDF, ale jakość jest raczej niska: (Język jest rumuński i jest to książka z fizjologii medycznej, na wypadek gdybyś się zastanawiał) Chcę wyodrębnić tekst z książki (1500 stron), ale zachowuj obrazy tak, jak są. Naprawdę nie sądzę, że mam szansę znaleźć rozwiązanie, więc na pewno kupię …
Szukam sposobu na konwersję tysięcy plików PDF do przeszukiwalnych plików PDF. Użyłem programu o nazwie „PDF Create Assistant”, który był dostarczany wraz z programem Nuance ecopy oprogramowanie. Nie możesz jednak wybrać folderu, musisz przejść do każdego podfolderu, wybrać pliki do przekonwertowania, a następnie przejść do następnego folderu. Jaki jest inny …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.