Система ИИ от Google учится паркуру: забавное видео
Специалисты Google Alphabet научили систему искусственного интеллекта DeepMind преодолевать препятствия в виртуальном пространстве. Для этого они воспользовались обучением с усилением — методом машинного обучения с использованием системы вознаграждения. В результате ИИ обучился паркуру.
Команда исследователей решила понаблюдать, будут ли простые награды (очки) работать в «сложной» среде. Они создали виртуальный курс паркура с различными досками и выступами и установили награду за прохождения каждого препятствия. Если говорить просто, то система работала так: чем быстрее ИИ перемещался по местности и продвигался вперед, тем больше он получал вознаграждений. Для более сложного уровня были добавлены также дополнительные бонусы и штрафы в случае «провала».
Исследователи обучили несколько видов «агентов»: безголовое тело с двумя ногами, «муравья» с 4-мя ногами и трехмерную фигуру человека. Каждый из них выполнял разные задания, поэтому специалисты могли наблюдать, как ИИ приспосабливаться к «сложной» среде.
Таким образом, система искусственного интеллекта DeepMind в процессе прохождения курса использовала систему проб и ошибок, чтобы выяснить, как двигаться вперед быстрее. На видео можно заметить, что ИИ иногда использует нестандартные решения, чтобы обойти препятствия, с которыми он сталкивается.
По словам разработчиков, их метод может помочь технологиям искусственного интеллекта достичь более гибкого и естественного поведения и научить их приспосабливаться к изменениям.