Deepfake: когда для создания видеоролика достаточно одной фотографии
Как вы пришли к deepfake?
Я родом из креативной рекламы, занималась маркетингом, коммуникациями, а последним местом была одна из крупнейших компаний, производящих контент для стокового рынка. Контента производилось так много, что можно было учиться им управлять, правильно его дистрибутировать, сохранять. Так я и познакомилась с технологической частью, связанной с процессами автоматизации производства, хранения и управления контентом. Удалось и многое понять про сам контент: в первую очередь, для чего и кем он создается. На стыке этих двух компетенций возникла идея полной автоматизации процесса создания контента. Вот так я сначала занялась дипфейками, а в прошлом году основала свою компанию. Сейчас мы уходим в стопроцентный синтез deepfake без съемочного процесса.
Сколько времени уходит на создание образа?
Смотря какого. К нам приходит много разных запросов, и мы понимаем, что наша аудитория часто хочет не создать внешность какого-то героя, а воссоздать личность, сущность персонажа, образ его мыслей, манеру речи, эмоциональную экспрессию. Вот со всем этим у ИИ пока еще не очень хорошо. К тому же исторические персонажи трудно «оживить», потому что мы не знаем ни голоса, ни манеры поведения, ни эмоциональности, скажем, того же Петра I. Мы можем анимировать изображение, которое у нас есть. Процесс «оживления» фотографий идет очень быстро. У нас есть технология, которая на основе одного фото за минуту создает минуту видеоконтента. Технология высокореалистичной генерации лиц в уже созданном контенте требует времени — от десяти дней на то, чтобы нейронная сеть поняла, как выглядит конкретный человек, создала и воспроизвела его лицо.