Искусственный интеллект научился играть в угадайку по картинкам

Искусственный интеллект теперь может хорошо играть в Pictionary, игре в угадывание слов, как в шарадах, в которой один человек должен нарисовать изображение, а другие постараются как можно быстрее понять, что они нарисовали.

Исследователи из Университета Суррея (Англия) создали бота Pixelor, систему искусственного интеллекта для соревновательных игр. ИИ умеет рисовать эскизы, которые распознаются людьми и машинами как предполагаемый объект, так же быстро — или даже быстрее — чем человек-конкурент.

«Наш ИИ может визуализировать эскиз с нуля. Назови слово «лицо», и он будет знать, что рисовать. При этом система будет каждый раз рисовать другого кота, другую собаку, другое лицо», — рассказывают авторы проекта.

Фото: digitaltrends.com

Человек может взглянуть на лицо и увидеть его как овал с двумя кружками вместо глаз, линией вместо носа и полукругом вместо рта. Для этого нужно понимать, что такое абстракция. У детей способность воспринимать изображение таким образом, среди прочего, свидетельствует о растущем когнитивном понимании концепций.

Однако, как и в случае со многими аспектами ИИ, возникает так называемый парадокс Моравека, согласно которому «относительно легко достичь уровня взрослого человека в таких задачах как тест на интеллект или игре в шашки, однако сложно или невозможно достичь навыков годовалого ребёнка в задачах восприятия или мобильности». Другими словами, более сложные проблемы машинам даются легче, чем простые задачи для уровня детского мышления.

Но это не неразрешимая проблема. Например, в 2016 году появился инструмент Sketch, нейронная сеть на основе глубокого обучения, которая могла распознавать нарисованные от руки эскизы и использовать их для поиска реальных предметов. Эта сеть была обучена с использованием набора данных, состоящего из примерно 30 000 сравнений фотографий и их эскизов. Pixelor тоже делает нечто подобное, но также может создавать свои собственные рисунки, а не просто распознавать рисунки других людей.

Цель игры Pictionary не просто нарисовать, например, кошку, а нарисовать кошку как можно меньшим количеством штрихов. Игра ведется на время. То есть для этого нужно создать ИИ, который мог бы изучить стратегии людей, чтобы хорошо играть в Pictionary.

Исследователи использовали QuickDraw, крупнейший на сегодняшний день набор данных эскизов. Затем они построили нейронный алгоритм для определения порядка штрихов, который должен сделать художник, чтобы дать предполагаемое представление объекта за как можно меньшее количество времени. Это означает разбиение эскизов на штрихи, затем изменение порядка этих штрихов и тестирование результатов до тех пор, пока они не установят точный порядок, в котором они должны быть сделаны.

Но цель исследователей не просто создать игрового бота. Авторы хотят разработать систему, которая лучше понимает, что важно для человека в конкретном изображении или сцене. Когда человек смотрит на картину или фотографию, то может почти сразу определить наиболее важные детали. Как научить компьютер этому? Оказывается, один из способов — это показать ИИ, как люди отдают приоритет наиболее заметным узнаваемым деталям изображения, когда они сами пытаются его изобразить.

За последние пару десятилетий ИИ постепенно побеждает человечество во все большем количестве игр: компьютер Deep Blue победил чемпиона по шахматам в 1997 году, IBM Watson в 2011 году обыграл людей в Jeopardy!, DeepMind обошел людей в игры Atari в 2013 году, AlphaGo обыграл людей в Го в 2016 году и так далее.

Команда может в будущем выпустить общедоступную версию этого бота для игры в Pictionary, чтобы люди могли по-своему обыграть систему. Новое исследование будет представлено на конференции SIGGRAPH Asia 2020 в ноябре.

Источник

Полный текст статьи читайте на Компьютерра