ИИ научился представлять пространство по одной картинке

033ffb3cf6a6d93118caa367caa80272_ce_3360

Для того, чтобы компьютер создал математическое описание пространства, заполненного объектами, обычно нужна большая база изображений. сделанных с разных ракурсов. Объекты на этих изображениях предварительно подписываются вручную. Разработчик и специалист по ИИ Али Эслами (S.M. Ali Eslami) и его коллеги в DeepMind нашли способ обходиться без таких баз данных, создание которых требует многих часов работы человека.

  • Технологии

    Майнинг: ещё не поздно, и не только биткойны

  • Технологии

    10 научно-популярных Telegram-каналов, на которые стоит подписаться

Как и человеческий мозг, ИИ Generative Query Network (GQN), созданный Эслами и его коллегами, домысливает невидимое и предполагает, что скрывается за поворотами. Если вы смотрите на стол и видите всего три ножки, вы знаете, что есть четвертая, и представляете ее расположение; посмотрев на комнату с одного ракурса, вы примерно представляете, как она выглядит с других; такого же результата добивались в DeepMind от GQN.

Сейчас для того, чтобы создать математическую модель пространства, GQN требуется несколько изображений с разных ракурсов; обработав их, ИИ моделирует трехмерное пространство и генерирует изображения с новых ракурсов, в котором учитывает расстояния между объектами и расположение источника освещения. Для простых пространств ему достаточно одной картинки.

Описание GQN опубликовано в журнале Science.

©  Популярная Механика