Ученые создали самую совершенную цифровую модель человеческого лица

image

Когда компьютеры обрабатывают лица, они иногда полагаются на объемные морфируемые модели (3D Morphable Model,3DMM). Модель представляет собой среднее лицо и содержит информацию об общих закономерностях отклонения от этого среднего. Например, если у вас длинный нос, у вас также может быть и широкий подбородок. Учитывая такие корреляции, компьютер может затем охарактеризовать ваше уникальное лицо, не сохраняя каждую точку в 3D-скане, а перечислив только пару сотен чисел, описывающих ваше отклонение от среднего лица, включая параметры, которые примерно соответствуют возрасту, полу и длине лица.

Однако есть одна сложность. Чтобы учесть все способы, которыми лицо может изменяться, 3DMM приходится интегрировать информацию о большом количестве лиц. До сих пор это требовало сканирования большого количества людей, а после — кропотливой маркировки всех их функций. Следовательно, самые лучшие современные модели основаны на лицах всего-то нескольких сотен человек — в основном, белых взрослых, — и имеют ограниченную способность моделировать лица людей разного возраста и рас.

Компьютерный исследователь из Имперского колледжа Лондона Джеймс Бут (James Booth) и его коллеги разработали новый метод, который автоматизирует создание 3DMM и позволяет им использовать более широкий спектр человеческих лиц. Метод состоит из трех основных шагов. Сначала алгоритм автоматически ориентирует сканирование лица на кончик носа и другие точки. Затем другой алгоритм выравнивает все сканы в соответствии с ориентирами и объединяет их в модель. Далее алгоритм ищет и удаляет плохие сканы.

Другие исследователи благосклонно восприняли идею Джеймса Бута. Уильям Смит (William Smith), изучающий компьютерное зрение в Йоркском университете в Великобритании, не участвовавший в исследовании, отметил, что автоматизация процесса создания моделей — действительно большой вклад в этой области. Другой ученый из Института исследования компьютерной графики им. Фраунгофера в Дармштадте Алан Брантон (Alan Brunton) сказал: «Маркировка десятков черт на большом количестве лиц довольно утомительна. Вы думаете, что нажать точку — это относительно легко, но не всегда очевидно, где находится, например, угол рта. Поэтому, даже когда вы делаете это вручную, высока вероятность допустить ошибку».

Бут и его коллеги на этом не остановились. Они применили свой метод к набору из почти 10 тысяч демографически разнообразных сканов лица. Сканирование проводилось в научном музее в Лондоне, пластическими хирургами Алланом Поннья (Allan Ponniah) и Дэвидом Данауэйем (David Dunaway), которые надеются улучшить восстановительные операции. Они обратились к Стефаносу Зафейри (Stefanos Zafeiriou), компьютерному исследователю из Имперского колледжа Лондона, за помощью в анализе данных.

Применение алгоритма к этим сканам привело к созданию того, что они называют «моделью лица крупного масштаба» (large scale facial model — LSFM). Как сообщают авторы, в тестах против существующих моделей LSFM гораздо более точно изображает лица. В одном сравнении они создали модель лица ребенка по фотографии. При использовании LSFM модель действительно выглядела как ребенок. Используя одну из самых популярных моделей, которая полностью основана на лицах взрослых, лицо ребенка предсказуемо выглядело как лицо взрослого.

У команды ученых было достаточное количество разверток для создания более специфичных модифицируемых моделей для разных рас и возрастов. Их модель может автоматически классифицировать лица в возрастных группах по форме.

Бут и другие исследователи уже поработали над новой моделью. В другом эксперименте они использовали 100 тысяч лиц, синтезированных их LSFM, чтобы обучить программу искусственного интеллекта превращать 2D-снимки в точные 3D-модели. Этот метод можно использовать для уточнения личности подозреваемого в совершении преступления по снимку с камеры, даже если он сделан под углом. Кроме того, при помощи этого алгоритма можно воплотить и оживить исторические фигуры, воссозданные из портретов.

Скоро на базе LSFM могут появиться медицинские приложения. Если кто-то потерял нос, технологи могут помочь пластическим хирургам определить, как должен выглядеть новый, учитывая остальную часть лица. Сканирование лица можно использовать для определения возможных генетических заболеваний, например, синдрома Уильямса — состояния, связанное с проблемами сердца, задержкой развития и особенностями лица, такими как короткий нос и широкий рот. Модель Бута и его коллег может повысить чувствительность таких тестов. Следующий шаг — включить в модели выражения лица, которые позволят распознавать лица с гримасами или улыбками.

© Geektimes