Российские программисты победили на международном конкурсе ИИ для Minecraft18.12.2019 18:24

Московские программисты стали победителями соревнования MineRL. Они предложили новый метод обучения с подкреплением на основе демонстраций, с помощью которого можно быстро и эффективно решать иерархические задачи в среде Minecraft: поиск ресурсов и создание новых инструментов. Использовать разработанные алгоритмы можно будет при создании автономных мобильных роботов и роботов-манипуляторов.

49f95b5f1ecc87918016a9d6af258021_cropped

Сергей Сысоев

18 декабря 2019 18:04

Обучение с подкреплением — интересная концепция, в которой обучаемый автомат помещается в некую среду, чаще всего — искусственную, которая, в зависимости от действий автомата, выдает ему поощрительные либо негативные оценки, в результате чего автомат изменяет свое устройство и правила принятия решений, стремясь к тому, чтобы «пряников» было больше, чем «кнутов». Разумеется, он должен отличать одно от другого и предпочитать «пряники».

Как сообщается в пресс-релизе МФТИ, сотрудники и стажеры лаборатории когнитивных динамических систем МФТИ и Института проблем искусственного интеллекта ФИЦ ИУ РАН — Алексей Скрынник, Эрмек Айтыгулов, Алексей Староверов, Кирилл Аксенов, Василий Давыдов и Александр Панов — предложили новый подход к обучению с использованием нового механизма забывания.

МФТИ Команда-победительница

«Команда лаборатории достигла отличного результата, достойно представив Физтех и Россию на международной конференции. Игровая среда Minecraft, в которой мы смогли продемонстрировать интеллектуальное поведение агента, реализует большое разнообразие разных типов взаимодействия человека со сложной, непредсказуемой внешней средой. В этом плане она является отличным симулятором, приближенным к реальности, и для нее намного сложнее разрабатывать методы обучения поведения, чем для таких сред как Go, Dota или Starcraft. Предложенный нами метод открывает новые пути для применения обучения с подкреплением уже в прикладных задачах, таких как беспилотный транспорт и роботы-манипуляторы», — сказал заведующий лабораторией когнитивных динамических систем Центра когнитивного моделирования Александр Панов.

«MineRL — это соревнование для интеллектуальных алгоритмов, а не вычислительных возможностей. До этого многие достойные результаты в области искусственного интеллекта достигались за счет «грубой силы» — большого количества GPU и CPU для обучения сложных систем, — добавил директор Физтех-школы прикладной математики и информатики Андрей Райгородский. — Как только в требования добавилась необходимость разработки вычислительно-эффективных методов, шансы всех команд уравнялись. В таких условиях наши ребята оказались лучше всех, опередив команды из США, Китая, Японии, Финляндии, Германии и других стран. Это в очередной раз подтверждает, что Физтех в целом и ФПМИ в частности — мировые лидеры в области искусственного интеллекта. И это на самом деле закономерно, потому что в Физтех-школе построена уникальная система взаимодействия академических базовых организаций и индустриальных партнеров.

Соревнование длилось пять месяцев, в нем было два раунда. В первом российская команда заняла третье место, во втором — обошла девять финалистов и заняла первое место с существенным отрывом. В конкурсе участвовали более 40 команд со всего мира.

Ещё больше по темам

Обсудить 0

Лучшее за неделю