Mam kilka tysięcy stron zeskanowanych stron książek. Każda strona jest zapisywana osobno jako JPG. Pismo jest jasne, ale czcionki różnią się, a strony zawierają zdjęcia i ilustracje.
Muszę utworzyć listę wszystkich słów pojawiających się w każdym pliku JPG. Czy istnieje narzędzie wiersza polecenia do skanowania obrazu z listą pojawiających się słów? To nie musi mieć idealnego skanowania, tylko oszacowanie.