Fox использует машинное обучение Google при создании фильмов

Исследователи из киностудии 20-th Century Fox и Google Cloud разработали программное обеспечение на основе машинного обучения, которое может анализировать трейлеры фильмов и прогнозировать, захотят ли люди смотреть эти картины в кинотеатрах. Недавний исследовательский документ описывает программу Merlin, которая способна распознавать объекты и закономерности в трейлере для анализа сцен фильма.

Технология может отсканировать трейлеры и обнаружить объекты вроде «человека с бородой», «пистолета», «автомобиля», а затем на основе контекста сделать вывод, является ли фильм боевиком или драмой. «Трейлер с длительным крупным планом персонажа вероятнее всего рекламирует драму,  — пишут авторы исследования, — в то же время трейлер с быстрыми и частыми сменами кадров более вероятен для боевика».

Merlin использует знания об общих закономерностях, чтобы понять, как последовательность событий в трейлерах отражается на ожиданиях зрителей с точки зрения жанра. Технология может распознать погоню на автомобилях и последующий взрыв и соответствующим образом пометить трейлер, подобрав заодно рекомендации с другими фильмами, включающими подобные автомобильные погони.

Merlin сравнивает эти теги с большим набором данных, который включает сотни фильмов и миллионы записей о посещениях. Fox и Google утверждают, что информация «полностью анонимна» и «не касается вторжения в частную жизнь», хотя неясно, о каких именно cведениях идёт речь и как они собираются. Согласно документу, описывающему Merlin, система включает информацию о посещаемости, в том числе «базовые демографические данные» на уровне отдельных людей.

Каталогизация и оценки Merlin на основе исторических предпочтений кинозрителей используются и для того, чтобы предсказать, будут ли люди покупать билеты на следующий крупный летний блокбастер, в котором есть «бородатые мужчины, оружие и автомобили». А начиная с картины «Величайший шоумен» 2017 года, 20th Century Fox использует прогнозы Merlin, чтобы решить, какие фильмы запускать в производство и как лучше их продвигать.

Проблема лишь в том, что искусство так не работает. Есть много факторов, которые способны сделать фильм успешным и которые компьютер идентифицировать не в состоянии, даже тот, который может правильно распознать бороду. В фильмах есть пантомима, неуловимая актёрская игра, тонкие шутки и трудные для количественной оценки нематериальные сущности, которые даже реальным людям сложно объяснить. Вот почему качественная критика фильмов весьма нетривиальна: есть бесконечные варианты анализа «хороших» и «плохих» картин. Впрочем, возможно, современные блокбастеры уже не являются в известной мере искусством, а выступают в качестве аттракционов, во время которых не требуется работа ума и сердца?

Чтобы понять ограничения Merlin, можно взглянуть на анализ фильма «Logan» 2017 года от режиссёра Джеймса Мангольда (James Mangold), который Google привела в качестве примера. Система проанализировала трейлер и отметила каждый распознанный объект, например: «машина», «автомобиль», «человек», «лицо», и, чаще всего, «дерево».

Merlin считает, что зрители «Логана», скорее всего, ходили в кино на «Великолепную семёрку», «Джейсона Борна», «Джона Уика 2» и «Легенду о Тарзане». Легко понять, как теги «человек», «борода» и «пистолет» приводят к рекомендациям вроде «Великолепной семёрки» и «Джона Уика 2», но, «Тарзан», вероятно, выбран из-за обилия распознанных деревьев. Из пяти наиболее популярных фильмов, которые реальные зрители смотрели до «Логана», Merlin выбрал правильно только один («Джон Уик 2») — «Джейсон Борн» и «Тарзан» не попали даже в топ-20.

Сомнительно, что алгоритм Merlin уловил суть или даже облик Хью Джекмана (Hugh Jackman), играющего старика Логана, которому всё сложнее жить в меняющемся мире. Однако руководство 20-th Century Fox считает, что выкладкам Merlin стоит доверять потому, что система предсказала 11 из 20 фильмов, на которые зрители «Логана» ранее ходили в кино. Они даже считают эти сведения важными при принятии решений о рекламных бюджетах и оптимальном продвижении картин.

Результаты показывают, что людям просто понять многие культурные вещи, которые машины пока не распознают. Обычный человек, вероятнее всего, назвал бы среди наиболее интересных аудитории «Логана» супергеройские фильмы вроде «Людей Икс», «Доктора Стрэнджа» или «Бэтмена против Супермена». Merlin пока не понимает культурный контекст, однако весьма точный выбор «Джона Уика 2» говорит о том, что в будущем подобные технологии могут стать достаточно совершенными.

Вне зависимости от потенциала, грустные мысли навевает тот факт, что киностудии уже используют инструменты вроде Merlin для усовершенствования своей деятельности: повторения успеха сорвавших кассу картин. «Исторически киностудии в значительной степени полагались на свой опыт при принятии решений об инвестировании в конкретный сценарий, но это может приводить к огромным рискам, особенно при вложениях в новые оригинальные истории», — сообщается в блоге Google.

Несложно представить будущее (потому что это уже во многом так), когда шаблонные фильмы, формирующие предпочтения массового зрителя, будут в свою очередь формировать и мнение автоматических алгоритмов, делающих фильмы ещё более шаблонными с целью минимизации финансовых рисков и дополнительного расширения аудитории. Круг замкнётся. Уже сейчас киноиндустрия стремится к постоянным перезапускам, попыткам создания «вселенных» или бесконечной эксплуатации уже созданных — ведь именно так Marvel и Disney зарабатывают миллиарды. Опираясь на инструменты вроде Merlin, мы получим отрасль, в которой каждый автомобиль должен попасть в погоню, а затем перевернуться и взорваться.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

© 3DNews