Инициатива по созданию полнофункциональной свободной системы распознавания речи14.10.2013 21:17

Представлен проект «Open Speech Initiative», в рамках которого планируется собрать группу разработчиков, заинтересованных в развитии полнофункциональной и качественной свободной системы распознавания речи. Инициатива будет развиваться под эгидой проекта KDE на сайте speech.kde.org. Целью Open Speech Initiative является объединение усилий разрозненных исследователей и разработчиков в направлении создания универсальной системы распознавания речи, подходящей для разных областей применения, обладающей высокой точностью распознавания и большим словарём. Для достижение данной цели требуется объединение в едином сообществе различных категорий энтузиастов, от разработчиков ПО до лингвистов и специалистов по цифровой обработке сигналов.

Open Speech Initiative будет курировать работу сообщества, координировать развитие и решать организационные вопросы. В настоящее время основная работа сосредоточена на низкоуровневых компонентах платформы и подготовке инфраструктуры и автоматизированных систем для оптимизации процесса построения более качественных акустических моделей. В планах на будущее упомянуто создание пользовательского ПО, которое сможет выступать в роли диктофона, печатающего текст под диктовку, или автомачески формировать субтитры для видео.

В настоящее время к инициативе уже подключились разработчики платформы Simon, позволяющей организовать управление десктопом при помощи голосовых команд без необходимости использования клавиатуры и мыши, а также сооснователь платформы SonicCloud. В анонсе упоминается создание на базе Simon рабочего прототипа приложения с функциями диктофона, пригодного для организации речевого ввода текстовой информации. В настоящее время система уже достаточно успешно позволяет вводить через диктовку небольшие заметки, в том числе распознавая команды для перехода к новому абзацу, вставки знаков пунктуации и спецсимволов.