Widziałem niektóre ebooki / gazety, które najwyraźniej zostały zeskanowane z ich papierowych wersji, ale tekst w ebookach / gazetach można niesamowicie skopiować. Przypuszczam, że bezpośrednio skanowane wersje musiały zostać przetworzone przez niektóre oprogramowanie do optycznego rozpoznawania znaków.
Chciałbym więc wiedzieć, jakie są zalecane oprogramowanie do optycznego rozpoznawania znaków? Zwłaszcza te, które są albo na Ubuntu, albo za darmo? Jeśli te dla systemu Windows są znacznie lepsze, daj mi również znać.
Szczególnie interesują mnie te OCR, które mogą zaakceptować zeskanowany plik pdf jako dane wejściowe i nadal produkować jako plik wyjściowy inny plik pdf, który wygląda tak samo jak plik wejściowy, ale z tekstem, który można skopiować.
Dziękuję i pozdrawiam!
Ogranicz jedno oprogramowanie na odpowiedź