Роботы в MIT научились сообща разносить пиво в условиях неопределённости
Робот-бармен и два робота-официанта
В Лаборатории компьютерных наук и искусственного интеллекта (Computer Science and Artificial Intelligence Laboratory) Массачусетского технологического института разработали принципиальный метод координации действий нескольких роботов. Метод основан на модели планирования совместной деятельности в условиях стохастичности, неопределённости и ограниченных коммуникаций (научная работа, pdf).
Алгоритм планирования совместных действий базируется на общей модели MacDec-POMDP, но использует правила действий, представленные в виде конечных операторов (finite-state controller), а не ищет правила в заданном заранее дереве решений, как это обычно принято.
На видео показано, как похожие на коробки на колёсах роботы-официанты ездят по офису и предлагают людям выпивку. Желающие получить пиво нажимают кнопку на теле робота. Официант запоминает местоположение страждущего на карте помещения и уезжает.
Официант едет к роботу-бармену — это модель PR2 производства Willow Garage (выпускается с открытым программным обеспечением). Тот кладёт баночку охлаждённого напитка в ёмкость для транспортировки на корпусе официанта — и мобильный робот возвращается по записанным координатам. При этом он может захватить с собой заказ, принятый другим роботом-официантом в той же комнате.
Авторы научной работы считают, что конечные операторы описывают действия гораздо точнее и лаконичнее, чем дерево решений. Такие описания легче интерпретировать, и они допускают работу в «бесконечном горизонте» возможных действий. Разработанный алгоритм поиска необходимых действий требует существенно более простого симулятора, который моделирует только результат работы заданного набора моторов. Таким образом, новый алгоритм способен решать гораздо больший набор проблем, чем существующие планировщики MacDec-POMDP.
Группа исследователей из Массачусетского технологического института усовершенствовала марковский процесс принятия решений (MDP). Он служит математической основой для того, чтобы смоделировать принятие решения в ситуациях, где результаты частично случайны.
Деятельность робота-бармена и роботов-официантов является демонстрацией того, что новый метод координации действий и принятия решений подходит для использования в практических задачах. В данном случае окружающая среда постоянно изменяется. Люди могут находиться в разных местах и меняют своё местоположение, что не мешает функционированию роботизированной «пивной команды».
Такие же принципы подходят для координации действий других групп роботов. Например, групп спасателей, пожарных, санитаров или полицейских.