[Перевод] ИИ-технологии компании Aflorithmic помогли цифровому помощнику заговорить голосом Эйнштейна13.05.2021 14:03

Технологии быстро развиваются, это касается многих отраслей и направлений. Одно из них — цифровые помощники, которые учатся общаться с человеком при помощи искусственного интеллекта. Ученым из компании Aflorithmic удалось не только научить своего робота общаться, но и восстановить голос Альберта Эйнштейна. Теперь умный ассистент компании говорит голосом великого ученого.

В проекте Aflorithmic также принял участие стартап UneeQ. Они разместили чат-бота на своем сайте, так что при желании поговорить с ним может любой желающий. Восстановление голоса ученого реализовано благодаря сохранившимся записям, пусть и плохого качества, плюс описаниям людей, которые с ним общались.

Обработанные данные показали, что ученый говорил с сильным немецким акцентом, что и раньше не являлось тайной. Плюс его голос был мягким и доброжелательным. Сказать, что голос бота идентичен голосу ученого, нельзя -, но он максимально к нему приближен.

К участию в проекте привлекли еще и актера, который, изучив особенности голоса ученого, проговаривал многие современные слова и термины. Например, «блокчейн» — ведь понятно, что сам ученый этот термин не произносил.

Ниже — реальная запись выступления Эйнштейна. К сожалению, голос слышен не очень хорошо — аудиодорожка не самого лучшего качества. Но представление о стиле, тембре, манере речи ученого составить можно без проблем.

Озвучить виртуального помощникаа можно было голосом практически любого человека. Эйнштейна выбрали потому, что это один из самых известных ученых и людей вообще. Кроме того, беседы с ним, по отзывам современников, были содержательными и приятными. Людям просто нравилось разговаривать с ним. Соответственно, партнеры проекта решили попробовать синтезировать похожий голос, чтобы, например, озвучить виртуального преподавателя физики или математики.

И, к слову, цифровой агент Aflorithmic может беседовать с любым из нас, причем в режиме реального времени — задержек практически нет. Все это позволяет создать впечатление реальной беседы с живым человеком, что очень необычно. Добиться этого удалось не сразу — сначала задержка между вопросом и ответом составляла около 12 секунд. Но после доработки алгоритма этот показатель удалось снизить до 3 секунд всего за две недели.

Сейчас участники проекта стараются улучшить алгоритм и технологию синтезирования голоса Эйнштейна. Но и то, что у них уже есть — впечатляет.