Yandex Cloud запустила нейросеть, которая одновременно общается на 10 языках
Облачная платформа Yandex Cloud выпускает нейросеть, которая может распознавать более 10 языков одновременно и соответствующим образом переводить ответы на вопросы. Она работает с английским, французским, датским, финским, турецким и другими языками. Об этом сообщила пресс-служба компании.
Модель распознаёт любую речь: короткие и длинные фразы, имена, адреса, даты и числа. Она может переключаться между языками в любой момент разговора. Разработчики считают, что на базе нейросети можно будет создавать многоязычных голосовых помощников и роботов для колл-центров.
Нейросеть работает на базе архитектуры Transformer. Она обрабатывает вводные слова параллельно и независимо друг от друга, а также быстро обучается. Нейросети можно давать подсказки, чтобы улучшить качество распознавания.
Модель готовили на датасетах Яндекса с десятками терабайтов данных из сервисов и приложений.
Многоязычная модель работает в сервисе синтеза и распознавания речи Yandex SpeechKit. Его используют больше 1000 клиентов, в том числе X5 Group и «Додо Пицца». Модель можно настроить стандартными средствами в API.
Ранее Яндекс выложил в свободный доступ нейросеть YaLM (Yet another Language Model) 100B для генерации и обработки текстов на русском и английском языках. На данный момент это самая большая GPT-подобная модель, находящаяся в открытом доступе. YaLM 100В содержит 100 млрд параметров — больше, чем любая другая существующая модель для обработки русского языка.
В 2021 году Яндекс открыл доступ к нейросети «Балабоба» для всех пользователей. Она работает на языковой модели из семейства YaLM. «Балабоба» может закончить историю, придумать подпись или написать небольшой рассказ.