ABBYY FineReader Engine помогает выделять текстовую информацию из видео

ABBYY Logo

Компания ABBYY сообщает о внедрении инструментария разработчика ABBYY FineReader Engine в аппаратно-программный комплекс приема и обработки телевизионных видеосигналов, телетекста и интернета АСПАТ, созданного компанией ЗАО «НТЦ Передовые Системы».

Система АСПАТ ориентирована на решение информационно-аналитических задач и предназначена для контроля, накопления и анализа новостной информации в ситуационных центрах, пресс-службах, аналитических отделах государственных и коммерческих организаций.

Современные телевещатели обладают оперативными средствами получения и трансляции новостей. АСПАТ позволяет записывать в различных режимах до 20 каналов одновременно, что составляет около 15000 часов исходного видео в месяц. Ручной просмотр и анализ такого объема видеоинформации для поиска необходимого контента - кропотливый и длительный процесс, поэтому работающий с видеоизображениями аналитик не может оперативно и эффективно искать интересующую его информацию. Так перед компанией встала задача автоматизировать извлечение данных из видеопотока - распознавать образы, речь, лица, текст, чтобы таким образом облегчить и расширить возможности поиска необходимых данных.

Руководство компании ЗАО «НТЦ Передовые Системы» приняло решение разработать функциональный модуль для выделения любой текстовой информации в кадре с бегущих строк, титров и подписей, используя ядро распознавания ABBYY.

Выбор технологии ABBYY определили многие параметры, но, в первую очередь, высокий уровень точности распознавания исходного видеоматериала (что особенно актуально, учитывая, что сам видеокадр обладает достаточно низким качеством). Также положительную роль сыграли такие возможности инструментария для разработчиков ABBYY FineReader Engine, как доступность информации о месторасположении распознанных текстовых данных в кадре, о степени уверенности распознавания текста, хорошо продуманный и простой в использовании API, подробная и понятная документация, стабильность функционирования, а также способность работать в ОС Linux.

В ходе проекта был создан функциональный модуль АСПАТ-Титр , который выделяет кадры из видеопотока, производит их предварительную обработку, запускает процесс распознавания для извлечения любой текстовой информации с кадра и осуществляет склейку извлеченных текстовых данных бегущей строки в единую логически законченную фразу. В дальнейшем вся текстовая информация индексируется, автоматически привязывается к рубрикам и становится доступной для поиска в системе АСПАТ.

Программный модуль АСПАТ-Титр стал составной частью системы АСПАТ и успешно прошёл тестовую эксплуатацию. На текущий момент средняя скорость обработки на одном процессорном ядре составляет 2 реальных масштаба времени, то есть около 250 часов видеофрагментов в сутки.

#vk

©  iXBT