Niedawno natknąłem się na Tesseract i OpenCV . Wygląda na to, że Tesseract to pełnoprawny silnik OCR, a OpenCV może być używany jako platforma do tworzenia aplikacji / usługi OCR.
Próbowałem użyć Tesseract na niektórych moich obrazach i jego dokładność wydaje się przyzwoita. Później natknąłem się na bardzo prosty samouczek dotyczący używania OpenCV do wykonywania OCR w Pythonie i byłem pod wrażeniem. W ciągu kilku minut skończyłem szkolenie systemu i jego dokładność była dobra. Ale oczywiście takie podejście oznacza, że muszę intensywnie trenować swój system przy użyciu dużego zestawu treningowego.
Moje konkretne pytania są następujące:
- Jak wybrać między Tesseract a użyciem OpenCV do zbudowania niestandardowej aplikacji OCR?
- Dostępne są zestawy danych szkoleniowych dla Tesseract dla różnych języków. Czy OpenCV ma coś podobnego, abym nie musiał zaczynać od podstaw, aby osiągnąć OCR?
- Który z nich jest lepszy w przypadku niedoszłej komercyjnej aplikacji?
Jakieś sugestie?