Byłem w pobliżu miejsca mojego dziadka w ostatni weekend. Moja babcia wyciągnęła tę gigantyczną (około 1400 stron) książkę z historii swojej rodziny sięgającą 1630 roku. Gigantyczny nerd, którym jestem, pomyślałem, że byłoby fajnie mieć wszystkie informacje przechowywane w bazie danych i dostępne w Internecie. Potrafię obsłużyć wszystkie programy internetowe i wyrażenia regularne, a co nie, ale nie wiem, co jest najlepszym sposobem na przeniesienie tekstu z książki na komputer.
Wiem, że niezbędny będzie pewien rodzaj OCR, z moich małych badań, które przeprowadziłem, wydaje się, że moje opcje to:
- zrób zdjęcie każdej strony aparatem, a następnie przetwarzaj zdjęcia za pomocą oprogramowania OCR
- użyj skanera, aby zeskanować każdą stronę, a następnie przetwarzaj za pomocą oprogramowania OCR
- użyj jakiegoś urządzenia ręcznego, takiego jak ten .
Czy ktoś ma jakieś pomysły na najlepszy sposób rozwiązania tego problemu? Nie chcę niszczyć książki, ponieważ o ile wiem, nie można jej zastąpić. To chyba jedyny raz, kiedy zeskanuję dużą książkę, więc nie sądzę, żebym chciał wydać więcej niż 250 USD na jakiekolwiek urządzenie. Nie mam nic przeciwko ręcznemu wysiłkowi (zdaję sobie sprawę, że najprawdopodobniej zajmie to miesiące), ale chciałbym znaleźć najbardziej efektywną metodę.
Uwaga na temat książki: ma ona tylko około 20 lat, więc jest w całkiem dobrym stanie. Jest monochromatyczny, a strony nie zaczęły żółknąć. Ponieważ jest tak duży, martwię się o możliwe cienie, gdy tekst zbliży się do wiązania.