ABBYY FineReader Engine 10: новая версия - быстро, точно и удобно

Компания ABBYY объявляет о выходе ABBYY FineReader Engine 10, новой версии инструментария разработчика (SDK), предназначенного для встраивания функций оптического распознавания текста в приложения независимых разработчиков. По сравнению с предыдущей версией SDK получил ряд существенных улучшений: увеличена скорость распознавания и повышено его качество, а интеграция технологий стала ещё удобнее и проще.

ABBYY FineReader Engine 10

Важнейшей задачей при создании новой версии SDK было повышение скорости распознавания. Теперь ABBYY FineReader Engine обрабатывает тексты на русском языке на 44% быстрее, а скорость распознавания для основных европейских языков (английский, немецкий, французский, итальянский, испанский) увеличена почти в 2 раза. В сочетании с технологией мультипроцессорной обработки, когда части многостраничного документа распознаются на нескольких процессорах одновременно, это улучшение существенно повышает эффективность и производительность конечного приложения.

Для удобства разработчиков в ABBYY FineReader Engine 10 расширены возможности API (интерфейс прикладного программирования) - работать с SDK стало ещё проще. Теперь в процессе создания собственного приложения разработчики могут воспользоваться специальными профилями, настроенными для решения ряда типовых задач, таких как конвертация документов для сохранения в архиве, преобразование документов для их последующего редактирования, извлечение опорного текста, штрихкодов или меток. Таким образом, разработчики могут легко и быстро получить оптимальные настройки распознавания, при этом весь широчайший функционал ABBYY FineReader Engine остаётся доступным для более детальной настройки.

Новая версия SDK предоставляет широкие возможности по работе с файлами формата PDF (в том числе PDF/A для архивного хранения). К примеру, ABBYY FineReader Engine 10 предлагает пользователю ряд режимов сохранения, среди которых он может выбрать оптимальный, - режим наилучшего качества, максимальной скорости, с минимальным размером файла или сбалансированный режим. Кроме того, ABBYY FineReader Engine 10 позволяет создавать PDF-файлы с ультравысоким сжатием MRC (Mixed Raster Content), в результате которого визуальные характеристики документа не страдают.

Кроме того, в ABBYY FineReader Engine 10 улучшена технология адаптивного распознавания документов (ADRT), с помощью которой SDK сохраняет структуру многостраничного документа, обрабатывая его как единое целое. Версия ADRT 2.0 выделяет не только такие элементы структуры, как колонтитулы, сноски, нумерацию страниц и заголовков, подписи картинок и графиков, но и восстанавливает оглавление документа, стили шрифтов и заголовков.

«В новой версии ABBYY FineReader Engine нам удалось совместить несовместимое: великолепную точность распознавания и высокую скорость обработки, - говорит Андрей Исаев, директор департамента продуктов для разработчиков. - Традиционно считается, что это два взаимоисключающих параметра, однако нашим учёным и инженерам удалось создать специальный режим, в котором они прекрасно сочетаются. Этот режим незначительно уступает в качестве распознавания самому точному режиму, но при этом скорость обработки до двух раз выше по сравнению с самым быстрым режимом предыдущей версии продукта».

Среди ключевых возможностей ABBYY FineReader Engine 10:
  • поддержка 198 языков распознавания (нет аналогов в мире);
  • высокое качество распознавания азиатских языков: в новой версии точность распознавания китайского, японского и корейского повышена на 40%;
  • поддержка многоязычных документов;
  • специальные функции для обработки фотографий в документах;
  • распознавание более 15 видов одномерных и основных двумерных штрихкодов.
  • Дополнительную информацию о продукте можно получить на сайте ABBYY.

    Ранее редакция THG.ru сообщала, что компания ABBYY представила ABBYY Recognition Server 3.0 - новую версию высокопроизводительного серверного решения для оптического распознавания любых документов и PDF-файлов. Управлять бумажным документооборотом в организации становится еще проще - система работает с изображениями, полученными со сканера, факса, МФУ или выделенной станции сканирования. ABBYY Recognition Server 3.0 легко и быстро превращает их в электронные документы наиболее популярных редактируемых форматов, в том числе DOC, PDF, Word XML и HTML. Готовые файлы могут экспортироваться в СЭД, ERP или электронный архив.

    ©  Tom's Hardware