Deepfake: когда для создания видеоролика достаточно одной фотографии16.05.2021 14:21

Рекламный ролик Сбера с героем комедии «Иван Васильевич меняет профессию» Жоржем Милославским определил тренд на использование технологии deepfake для создания видеоконтента. Мария Чмир, генеральный директор компании Deepcake.io, вернувшей обаятельного киноперсонажа на экраны, провела презентацию на международном форуме IPQuorum 2021: Tech for Content, в рамках которой представила собственные высокотехнологические решения, способные генерировать еще более убедительные deepfake-модели, чем Жорж Милославский. В интервью Мария Чмир подробно рассказала о том, как с помощью новых технологий создается видео без съемочного процесса.

Как вы пришли к deepfake?

Я родом из креативной рекламы, занималась маркетингом, коммуникациями, а последним местом была одна из крупнейших компаний, производящих контент для стокового рынка. Контента производилось так много, что можно было учиться им управлять, правильно его дистрибутировать, сохранять. Так я и познакомилась с технологической частью, связанной с процессами автоматизации производства, хранения и управления контентом. Удалось и многое понять про сам контент: в первую очередь, для чего и кем он создается. На стыке этих двух компетенций возникла идея полной автоматизации процесса создания контента. Вот так я сначала занялась дипфейками, а в прошлом году основала свою компанию. Сейчас мы уходим в стопроцентный синтез deepfake без съемочного процесса.

Сколько времени уходит на создание образа?

Смотря какого. К нам приходит много разных запросов, и мы понимаем, что наша аудитория часто хочет не создать внешность какого-то героя, а воссоздать личность, сущность персонажа, образ его мыслей, манеру речи, эмоциональную экспрессию. Вот со всем этим у ИИ пока еще не очень хорошо. К тому же исторические персонажи трудно «оживить», потому что мы не знаем ни голоса, ни манеры поведения, ни эмоциональности, скажем, того же Петра I. Мы можем анимировать изображение, которое у нас есть. Процесс «оживления» фотографий идет очень быстро. У нас есть технология, которая на основе одного фото за минуту создает минуту видеоконтента. Технология высокореалистичной генерации лиц в уже созданном контенте требует времени — от десяти дней на то, чтобы нейронная сеть поняла, как выглядит конкретный человек, создала и воспроизвела его лицо.

Мария Чмир, генеральный директор компании Deepcake.io