Система ИИ от Google учится паркуру: забавное видео11.07.2017 14:06

1e9cada8fe2efb497accda92c3b46b95_ce_1392

Специалисты Google Alphabet научили систему искусственного интеллекта DeepMind преодолевать препятствия в виртуальном пространстве. Для этого они воспользовались обучением с усилением — методом машинного обучения с использованием системы вознаграждения. В результате ИИ обучился паркуру.

Технологии
iPhone на колесиках: городской транспорт по‑русски
Технологии
Российские суда на подводных крыльях: впервые в XXI веке

Команда исследователей решила понаблюдать, будут ли простые награды (очки) работать в «сложной» среде. Они создали виртуальный курс паркура с различными досками и выступами и установили награду за прохождения каждого препятствия. Если говорить просто, то система работала так: чем быстрее ИИ перемещался по местности и продвигался вперед, тем больше он получал вознаграждений. Для более сложного уровня были добавлены также дополнительные бонусы и штрафы в случае «провала».

Исследователи обучили несколько видов «агентов»: безголовое тело с двумя ногами, «муравья» с 4-мя ногами и трехмерную фигуру человека. Каждый из них выполнял разные задания, поэтому специалисты могли наблюдать, как ИИ приспосабливаться к «сложной» среде.

Таким образом, система искусственного интеллекта DeepMind в процессе прохождения курса использовала систему проб и ошибок, чтобы выяснить, как двигаться вперед быстрее. На видео можно заметить, что ИИ иногда использует нестандартные решения, чтобы обойти препятствия, с которыми он сталкивается.

По словам разработчиков, их метод может помочь технологиям искусственного интеллекта достичь более гибкого и естественного поведения и научить их приспосабливаться к изменениям.