Preferowane oprogramowanie typu open source, ale nie konieczne.
Mam Adobe Acrobat 8 i bardzo podoba mi się funkcja OCR, która może zasadniczo umieścić niewidoczną warstwę tekstu OCR na zeskanowanym dokumencie. Zatem na ekranie widzisz oryginalny zeskanowany dokument, ale wynik można przeszukiwać.
To, czego szukam, to sposób na zautomatyzowanie tego procesu. Obecnie mam kilka skryptów, których używamy do przetwarzania i archiwizacji zeskanowanych plików, i szukam czegoś, co mogę podłączyć bezpośrednio do tego procesu wsadowego, aby wykonać OCR w sposób podobny do tego, co mogę zrobić z Acrobat.
Wszystkie sugestie mile widziane, dziękuję!