Tesseract 3.00 — новая версия ПО для оптического распознавания текста
Программисты компании Google выпустили третью версию Tesseract, системы оптического распознавания текста.
В новой версии добавлена поддержка множества языков, включая русский.
В числе прочих изменений:
- добавлен новый модуль анализа структуры документа;
- добавлена поддержка формата HOCR;
- библиотека Leptonica стала основной для работы с изображениями;
- переписан код для работы с неоднозначно распознанными символами;
- удалена поддержка VC++6.
Загрузить можно здесь.