Użyłem wcześniej funkcji Preview i Automator, aby wyodrębnić tekst z dokumentów PDF, ale nie działają one na skanowanych. Jak mogę wyodrębnić zawartość zeskanowanych plików z zachowanym formatowaniem? Nie chcę płacić za Adobe.
Użyłem wcześniej funkcji Preview i Automator, aby wyodrębnić tekst z dokumentów PDF, ale nie działają one na skanowanych. Jak mogę wyodrębnić zawartość zeskanowanych plików z zachowanym formatowaniem? Nie chcę płacić za Adobe.
Odpowiedzi:
Jak już powiedziano, zeskanowane dokumenty to obrazy (tekstu). Aby zrozumieć tekst, musisz uruchomić OCR (Optical Character Recognition) nad tym dokumentem.
Dostępnych jest kilka produktów OCR dla komputerów Mac i może być tak, że twój skaner jest dostarczany z takim produktem. Jednak prosząc o formatowanie, żądasz pewnych dość zaawansowanych funkcji, które nie są dostępne w podstawowych produktach. Dlatego możesz oczekiwać, że zapłacisz za to oprogramowanie OCR. Z tego punktu widzenia możesz ponownie rozważyć program Acrobat.
Przez „zeskanowane” przypuszczam, że masz na myśli, że dokument zawiera tylko obrazy tekstu, a nie znaki tekstowe. W takim przypadku należy użyć oprogramowania do optycznego rozpoznawania znaków (OCR).
W systemie operacyjnym Windows istnieją FreeOCR , a9t9 i inne . Istnieje również oprogramowanie na Androida, Linux i Mac, a także dostępne są usługi internetowe oparte na przeglądarce.