К сожалению такого пока нет в природе, ну и хорошо, ведь был бы он платный, а так - есть бесплатные альтернативы. Например CuneiForm, да еще и с возможностью распознавания русскоязычных текстов. Пакета deb я не нашел, пришлось устанавливать его из исходников. Для вас у меня есть хорошая новость: с помощью checkinstall я собрал deb и, если у вас тоже архитектура i386, то берите и пользуйтесь - cuneiform_20091224-1_i386.deb.
Запуск
Программа консольная, запускается по команде cuneiform. Если при запуске она будет ругаться что-то вроде
cuneiform: error while loading shared libraries: libpuma.so: cannot open shared object file: No such file or directory
то нужно скопировать библиотеку libpuma.so в директорию /usr/lib/ и выполнить команду ldconfig. Эту библиотеку вы сможете найти в самом файле deb если его не устанавливать, а просто распаковать как обычный zip-архив.
Использование
Если у вас имеется файл example.bmp с русскоязычным текстом, вы сможете распаковать его по команде
cuneiform -l rus example.bmp
и в той же директории появится файл cuneiform-out.txt с оцифрованным текстом.
Графическая оболочка
Исходники GUI который называется Cuneiform-qt можно скачать на sourceforge.
Можете скачать cuneiform-qt_0.1.1-1_i386.deb здесь
После установки запуск GUI будет доступен через главное меню в разделе Офис.
Консольный вариант может оцифровывать только bmp, cuneiform-qt оцифровывает форматы bmp, jpg, png, tif. И как обычно - бесплатно ;)
все отлично работает, немного неудобно все в BMP конвертировать, но это мелочи, при хорошем качестве картинки распознание очень качественное, иногда путает буквы О с А, и Ы с М в остальном все ОК
ОтветитьУдалитьЭтот комментарий был удален автором.
ОтветитьУдалитьА у меня после распознавания просто набор букв и больше ничего или просто пустой лист помогите пожалуйста =)
ОтветитьУдалитьПопробуй поставить yagf, он работает гораздо лучше.
ОтветитьУдалить