Сбер запустил в Telegram бота, который переводит аудиофайлы в текстовый вид

6e3d5bf3f7d57318154c3a0287b955b6.png

Команда SberDevices объявила о запуске бесплатного бота в Telegram для перевода русскоязычных голосовых сообщений в текст. Он работает на основе технологий платформы речевых сервисов SmartSpeech. 

Бот доступен по ссылке здесь. Он может оказаться полезным специалистам, которые работают с аудиозаписями и текстом. Бота также можно использовать в личной переписке и добавлять в групповые чаты.

SmartSpeech Bot поддерживает файлы в форматах MP3, WAV (8–96 кГц), FLAC и OggOpus объёмом до 20 Мб. Голосовое сообщение преобразуется ботом в текст благодаря технологии распознавания речи (Automatic Speech Recognition, ASR) платформы. Она также может применяться бизнесом в интерфейсах голосового ввода, например, на веб-сайтах.

Саму технологию SmartSpeech Сбер позиционирует как платформу речевых сервисов. На сайте проекта компания обещает, что она может фильтровать фоновые шумы, определять эмоциональность речи говорящего, расставлять знаки препинания и определять конец высказывания. Кроме того, в SmartSpeech есть обратная функция, которая позволяет генерировать речь.

© Habrahabr.ru