Tesseract 4.0 nie odczytuje obrazów za pomocą tylko jednego Word of Text

Używam Tesseract v4.0.0-beta.1-108-gf291 Obraz 5.jpg nie jest odczytywany (jedno słowo: znaki o ładnych rozmiarach) tesseract 5.jpg out.txt Próbowałem wszystkich opcji --psm i nadal nie czytałem Jednak obraz (50.jpg) jest czytany naprawdę dobrze… Co tu się dzieje? Jedno słowo nie jest czytane, a duży dokument z małym złożonym testem jest odczytywany dobrze… Każda pomoc jest doceniana. pozdrowienia

microsoft-word tesseract-ocr

— YounesCHTIOUI
źródło

Nie używam tego narzędzia, tylko kilka ogólnych wskazówek: 1. Narzędzia OCR mają optymalny rozmiar znaków, mogą nie rozpoznać zbyt dużych postaci. 2. narzędzia te analizują również kilka znaków, aby zdecydować o rodzaju czcionki, mając tylko kilka znaków, mogą nie rozpoznać ich. 3. Wygląda na to, że używasz wersji beta, z definicji nie jest jeszcze ukończona, powinieneś skontaktować się z deweloperem i przekazać im opinię (= pomóc im się poprawić) zamiast pytać tutaj.

— Máté Juhász