[Перевод] Синтезированные ИИ голоса актеров позволяют обходиться без иностранной озвучки
Следующий фильм или ТВ-шоу, которые вы будете смотреть, могут оказаться «работой» искусственного интеллекта. Представьте, что актеры Голливуда, Болливуда или любых других студий говорят на родном для вас языке в любом из новых фильмов или шоу. На самом деле, это вполне реальная история, вот только голоса могут не принадлежать человеку — все это дипфейки, правда, не мошеннические, а созданные самими киностудиями с использованием ИИ.
Уже сейчас видео- и голосовые дипфейки вполне сносно копируют оригинал А в ближайшем будущем эти технологии станут еще более совершенными. Компании смогут получать копии голосов актеров, говорящих на самых разных языках. И это будут не лишенные выражения «голоса» вроде современных цифровых агентов, а очень реалистичные голоса, снабженные эмоциями. Цифровые актеры смогут плакать, смеяться, бормотать — причем максимально близко к оригинальной озвучке.
Все это — не фантазии, а реальность сегодняшнего дня. Чем больше фильмов и ТВ-шоу выходит на экраны, тем более прибыльным становится дубляж. ИИ постепенно проникает в эту отрасль, синтезируя не просто голоса актеров. Технологии позволяют «омолодить» голос, то есть фильм, в котором снимается пожилой актер, может быть снабжен «молодым» голосом этого человека. Кроме того, можно создавать и вовсе искусственные голоса, которые принадлежат уже умершим актерам или тем из них, кто потерял голос. Ну и да, сами актеры при этом могут сидеть дома и пить чай, не утруждая себя выездом на студию звукозаписи. Да и домашняя студия в этом случае совсем не нужна.
При этом производитель фильма вовсе не обязан рассказывать зрителю о том, что голос — синтезированный. Одно дело роботы колл-центра, и совсем другое — озвучка фильмов или ТВ-шоу.
Все, о чем здесь говорится — вовсе не фантастика. Совсем недавно при помощи ИИ был озвучен на разные языки фильм «Every Time I Die» 2019 года. Это была одна из первых попыток заменить голос актера дубляжа цифровым агентом. И все получилось — даже разработчик этой технологии далеко не всегда мог отличить синтезированный голос от настоящего.
Скорее всего, эта тенденция с течением времени будет только усиливаться, так что сама роль актера дубляжа будет становиться все менее востребованной. Обучить нейросеть, которая послужит основой для очередного голоса актера, просто. Для этого нужно всего 5 минут записи, где переводчик наговаривает текст поверх английского оригинала.
Сейчас технология уже используется. Например, она применялась в «Мандалорце», когда показывали Люка Скайуокера. Дипфеком заменили голос настоящего Марка Хэмилла, которому уже 70 лет. Об этом студия особо не распространялась, но это вполне реальный проект. Причем подавляющее большинство зрителей не осознавало, что голос — ненастоящий.
Хэммил сам дал разрешение на использование его голоса. И компания Respeecher. Воспользовалась этим разрешением, обучив нейросеть на основе фрагментов записи голоса актера 40-летней давности. Источниками послужили прежние эпизоды фильма, старое радиошоу и записанный на пленку голос Хэмилла.
По словам создателя технологии, обычно человек улавливает голос, синтезированный ИИ. Его выдает ряд признаков, включая отсутствие эмоций, некая «металличность» и прочее. Сейчас же этих барьеров нет и человеку стало очень сложно отличить настоящий голос от дипфейка.
Подобными проектами параллельно занимается несколько компаний. Например, лондонская компания Sonatic недавно воспроизвела голос Вэла Килмера. Этот известный актер утратил прежний тембр, тональность и т.п. из-за проблем с гортанью. Симуляция оказалась настолько реальной, что его собственный сын заплакал, услышав голос отца. «Идея возможности настраивать голосовой контент, изменять эмоции, высоту тона, направление, темп, стиль, акценты — теперь это возможно там», — говорит генеральный директор Sonantic Зина Куреши.
Дипфейки подобного рода могут использоваться не только для озвучки фильмов, но и для другого контента, включая видеоигры. Переозвучивать можно и старые фильмы с поврежденной или не очень естественной аудиодорожкой. ИИ справляется с этими задачами без особых проблем.
Конечно, здесь не обойтись и без рисков — индустрия дипфейков развивается очень активно. Если не учитывать подделку голосов политиков, глав компаний и т.п., о чем мы расскажем в одном из последующих материалов, все равно можно столкнуться с противозаконными действиями предприимчивых бизнесменов. Недавно голос Моргана Фримена был использован в рекламе, связанной с компанией, которая даже не попыталась связаться с актером.
Но как бы там ни было, искусственные голоса постепенно занимают свою нишу — разрешения актеров на использование их голосов запрашивает все большее количество компаний. Среди них — как киностудии, так и обычные рекламные агентства. В ближайшем будущем, вероятно, ИИ-студии дубляжа станут весьма востребованным сервисов. Если еще не стали — ведь их услугами уже активно пользуются десятки компаний.