Skanowanie i rozpoznawanie wyróżnionego tekstu


1

To pytanie zostało zadane na forum Adobe Acrobat. Piszę tutaj, ponieważ szukam rozwiązania tego samego zadania, ale nie wymagam, aby rozwiązanie korzystało z programu Adobe Acrobat.

Czy istnieje sposób wydrukowania pliku PDF: Podświetl ręcznie markerem. Następnie ponownie zeskanuj dokument, a oprogramowanie rozpozna podświetlony tekst, a następnie podświetl go „elektronicznie” w pliku PDF. Powodem jest to, że muszę go wydrukować, ponieważ potrzebuję wielu stron, aby położyć się obok siebie i podświetlić tekst markerem. Jest to po prostu bardziej praktyczne do czytania publikacji naukowych.

https://forums.adobe.com/thread/1384310


Większość OCR próbuje ignorować artefakty, które nie są częścią postaci. Podświetlenie zmniejsza kontrast i zmniejsza rozpoznawanie. Byłbym zaskoczony, gdyby jakikolwiek pakiet OCR zrobił to, co chcesz. Ale gdyby tak było, byłoby to bardzo zależne od koloru, którego używasz. Niektóre kolory są wykrywane znacznie lepiej niż inne, a różne kolory przekształcają się w skalę szarości lub czarno-białe przy różnych ciemnościach / gęstościach. Byłaby to równowaga między wykryciem a degradacją tekstu, dlatego warto poeksperymentować z różnymi kolorami zakreślacza.
fixer1234
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.