«Яндекс» запустил облачный сервис распознавания речи22.08.2014 00:05

«Яндекс» сообщил о запуске SpeechKit Cloud, основанного на облачных технологиях. Новая платформа позволит пользователям использовать функции распознавания голосовых команд в различных устройствах, сервисах и приложениях.

Как отметили разработчики, новый инструмент может быть использован в компьютерах (голосовой ввод, управление игровым процессом), в медицине (протоколирование операций или осмотра пациента), в телефонии (автоматизация информирования, голосовое меню), в автомобилях (управление функциями автомобиля) и других сферах.

В настоящее время новый сервис уже используют компании Cubic Robotics (производитель домашнего робота Cubic) и Oktell (занимается выпуском ПО для колл-центров). Система Oktell способна распознавать речь звонящего и автоматически соединять его с нужным отделом, домашний робот распознает вопросы, что позволяет ему отвечать на них.

SpeechKit Cloud распознает турецкий и русский языки. Качество распознавания русских фраз составляет: геозависимые запросы — 95%, короткие фразы на произвольную тематику (3–5 слов) — 85% и диктовка текстов — 82%.

За процесс обработки голосовых команд отвечают серверы «Компании». Процесс происходит в режиме реального времени. Разработчики заверили, что на распознавание уходит около секунды.

Доступ SpeechKit Cloud основан на HTTP API. Представители «Яндекса» отметили, что данная платформа является для разработчиков наиболее простой. Для интеграции нового инструмента достаточно прочитать несколько страниц документации и добавить несколько строк кода в продукте, подключаемом к сервису.

У разработчиков есть возможность бесплатно тестировать платформу в течение 30 дней. В дальнейшем стоимость использования будет зависеть от необходимого количества запросов.

Разработчики рассказали, что средняя стоимость тысячи голосовых запросов составит 5 долларов. При этом некоторым организациям (например, медицинским и некоммерческим образовательным структурам) компания готова оказывать услуги бесплатно.

В основе нового сервиса лежит технология Yandex SpeechKit, запущенная в 2013 году. Основана технология на языковых и акустических моделях, сформированных при помощи нейронных сетей.

Полный текст статьи читайте на PCNEWS