Google представила переводчик, который дорисовывает мимику говорящего на видео
Переводчики и таксисты первыми пострадают от распространения ИИ.
Как сообщает TechCrunch, корпорация Google на своей конференции для разработчиков продемонстрировала новый этап в развитии систем машинного перевода. Распознаванием речи и её синтезом уже давно никого не удивишь, но американская компания дополнила эти решения синтезом артикуляции говорящего человека, который позволяет зрителю поверить, что тот выступает на другом языке, попадая губами в слова, которые он на самом деле никогда не произносил.
Источник изображения: Getty Images
«Универсальный переводчик» Google способен по видеоролику распознать речь на исходном языке, перевести её в текстовую форму и переложить на другой язык, после чего сгенерировать речь уже на целевом языке с сохранением интонаций и тембра голоса исходного варианта, и в конце подрисовать движения губ и жестикуляцию на новом видео, создавая у зрителя ощущение, что изначально выступление было записано на другом языке.
Такая технология вызывает огромный соблазн злоупотребления реалистичностью своими результатами, поэтому на первых этапах Google будет тщательно контролировать распространение этого переводчика, а результаты его работы наделять специальными метками — как видимыми, так и скрытыми, чтобы пользователи могли достоверно определить, что перед ними результат работы искусственного интеллекта.