Вышел консольный вариант системы распознавания текстов ABBYY FineReader 11 для Linux
Компания ABBYY выпустила одиннадцатую версию системы распознавания текстов ABBYY FineReader Engine CLI для Linux. CLI-версия FineReader работает в режиме командной строки и поддерживает обработку документов в форматах RTF, HTML, XML и PDF. Начиная с выпуска 11 добавлена поддержка форматов PDF/A-2, ODT, FB2 и ePub. Программа позволяет переводить содержимое таблиц, распознавать 1D и 2D штрих-коды, обрабатывать документы с текстом на нескольких языках (всего поддерживается около 190 языков). Кроме новых форматов для экспорта распознанных страниц, в версии 11 обеспечено распространение 64-разрядных сборок пакета, добавлена поддержка многопоточного распознавания с задействованием всех ядер CPU, реализована возможность использования профилей обработки (преобразование документов, архивирование документов, выделение текста, распознавание штрих-кодов и т.п.), добавлен режим быстрого распознавания (на 92% быстрее с незначительным ухудшением точности), добавлена поддержка новых видов штрих-кодов, осуществлён переход на новые алгоритмы препроцессинга и бинаризации для повышения качества изображений.
Программа является коммерческим продуктом, но с сайта проекта можно загрузить пробную версию, которая позволяет бесплатно распознать 100 страниц за 10 дней. Стоимость коммерческой версии составляет 149 евро с ограничением в 12 тыс. страниц в год и 999 евро с ограничением 120 тыс. страниц в год. Обладатели лицензии на прошлый выпуск ABBYY CLI OCR for Linux 9 смогут использовать 11 версию без реактивации.
© OpenNet