ВТБ представил голос для умного финансового ассистента с помощью технологии Yandex.Cloud
ВТБ разработал брендированный голос для умного финансового ассистента с использованием технологии от Yandex.Cloud — SpeechKit Brand Voice, рассказали «Хабру» в банке. ВТБ обещает, что голосовой ассистент сможет консультировать пользователей по финансовым услугам уникальным, полностью синтезированным голосом.
Сейчас разработанный банком голос используется в голосовом помощнике Алиса, в течение года он появится в мобильном приложении ВТБ Онлайн. В пресс-релизе ВТБ говорится, что пользователи смогут задавать ассистенту любые вопросы по продуктам и услугам — например, помощник расскажет об условиях по оформлению счетов и кредитных карт, подскажет существующие бонусные опции и др. Для озвучки выбрали голос российского актера театра, кино и дубляжа Владимира Зайцева, который дублировал Роберта Дауни-младшего и Джейсона Стэтема, а также Геральта из Ривии в первой части серии игр «Ведьмак».
В компании отмечают, что консультация с ассистентом через навык Алисы будет конфиденциальна. Для активации голосового помощника необходимо сказать Алисе «Запусти навык «Помощник ВТБ» через приложение «Яндекса» или в умных колонках «Яндекс.Станция».
Голос ассистента был синтезирован с использованием технологии Yandex SpeechKit Brand Voice. Она разрабатывалась на базе речевых ML-моделей — в банке утверждают, что технология позволяет создавать полноценные цифровые копии голоса человека. Модели обучались с помощью трансформеров, поскольку они могут обрабатывать весь массив текста сразу в отличие от последовательных нейросетей. Благодаря этому уменьшается время разработки и повышается качество синтеза и распознавания человеческой речи, говорят в ВТБ. Специалисты Yandex.Cloud обучили ML-модель на датасете из десятков часов записей голоса реального человека и передали её разработчикам ВТБ.
В банке отметили, что модель будет регулярно дообучаться, что позволит повышать качество взаимодействия с пользователями и добавлять новые сценарии.
Yandex SpeechKit Brand Voice была представлена компанией в июле 2021 года. С помощью технологии сторонние компании смогут синтезировать голос для голосового помощника, автоматизированных колл-центров, опросов, телемаркетинга и контроля качества.