Применение IaaS: Какие сервисы распознавания речи живут в облаках
В нашем блоге на Хабре мы уже рассказывали об опыте реальных компаний, которые решили перейти на использование IaaS-облаков — в их числе, к примеру, сервис бронирования отелей Hotels.ru и сеть постаматов PickPoint. В нашем сегодняшнем материале — рассказ о том, как облака использует Центр речевых технологий.
Речевые технологии
Центр речевых технологий (ЦРТ) занимается, соответственно, их разработкой и был основан в начале девяностых годов прошлого века учеными-акустиками. Бизнес компании постепенно развивался и к концу столетия были заключены первые контракты с зарубежными заказчиками.
Команде ЦРТ удалось научиться создавать продукты очень высокого уровня, которые зачастую даже превосходили по своим характеристикам зарубежные аналоги — известен даже случай, когда на крупной выставке CeBIT представители компании-конкурента тайно и под чужим именем покупали разработанный ЦРТ комплекс шумоочистки SoundCleaner (что не помогло им превзойти этот продукт).
За годы работы эксперты ЦРТ создали целый ряд успешных продуктов. И вот лишь некоторые из них:
VoiceFabric
Это облачный сервис синтеза речи, который позволяет записывать аудиоподкасты, озвучивать книги, видеоролики, переводить в звук текст из статей, создавать динамическую информацию для IVR-меню и так далее. VoiceFabric «живет» в облаке.
Синтезировать речь с помощью VoiceFabric можно двумя способами — прямо на сайте, скопировав текст в специальной окно, или с помощью API, которое позволяет разработчикам сторонних приложений озвучивать тексты автоматически. Обмен информацией по API осуществляется по протоколу HTTPS.
На выходе получается звуковой файл в raw-формате и параметрами codec = pcm, bit = 16 rate = 8000 или 22050 (в зависимости от голоса).
Мобильное приложение «Читатель»
Этот инструмент озвучивает (то есть читает вслух) синтезированным голосом загруженные книги и документы. Таким образом из любого текстового файла можно сделать аудиокнигу. Технология ЦРТ позволяет переводить текст в речь прямо на мобильном устройстве.
Сейчас в «Читателе» есть шесть русскоязычных голосов, скоро будет добавлена и поддержка английского и казахского языков. Приложение работает на устройствах под управлением Apple и Android. К настоящему моменту его скачали около 100 тысяч раз.
Виртуальный консультант «Мегафона» (демостенд)
Мобильный оператор «Мегафон» при участии специалистов ЦРТ разработал голосового виртуального консультанта по имени «Елена». Это «сотрудник» службы клиентского сервиса, который может обрабатывать более миллиона клиентских запросов в год и доступен в режиме 24/7. Елена помогает клиентам получать нужную информацию и управлять услугами оператора.
Такой виртуальный помощник нужен для того, чтобы клиенты могли решить базовые вопросы без необходимости блуждать в лабиринтах голосового меню или ожидания на линии момента, когда освободится живой оператор.
Елена способна обучаться и помогать в решении большей части типовых запросов. Сейчас эта виртуальная сотрудница умеет определять тему обращения, отвечать на вопросы, запрашивать дополнительную информацию, а в будущем научиться еще и предлагать сразу несколько вариантов решения проблемы клиента. В основе Елены — созданный в Центре речевых технологий сервис распознавания.
Существенная часть обращений в контакт-центр носит типовой характер и может быть автоматизирована с помощью современных речевых технологий. Работая в тесном сотрудничестве с «МегаФоном», ЦРТ создал не просто справочник с голосовым управлением, а настоящую «персону», общение с которой максимально приближено к естественному.
— Команда ЦРТ
Система голосового самоосблуживания VoiceNavigator
Решение VoiceNavigator предназначено для контакт-центров, с помощью него компании могут строить системы голосового самообслуживания. VoiceNavigator позволяет автоматически обрабатывать входящие вызовы с помощью технологий распознавания и синтеза речи.
С помощью этого сервиса можно создать сложные справочные системы с многоуровневыми меню, системы массового обслуживания — например, автоинформаторов расписания движения пассажирского транспорта, сервисы автоматического бронирования билетов и услуг, системы голосовой аутентификации.
Заключение
Описанные выше сервисы Центра речевых технологий работают из облака, использующего в том числе ресурсы «ИТ-ГРАДа» — это позволяет обслуживать большое количество пользователей. Одной из причин выбора IaaS-облака стала возможность получения пула вычислительных ресурсов с высокой доступностью.
Поскольку ЦРТ регулярно проводит высоконагрузочное тестирование продуктов, а также реализует внешние проекты, выбор в пользу облака является совершенно оправданным.
— Команда ЦРТ
На сегодня все, спасибо за внимание! Не забывайте знакомиться с новыми материалами в первом блоге о корпоративном IaaS.