Роботы учатся выполнять домашние дела, глядя как это делают люди
Роботы учатся помогать людям дома. Это один из самых трудных для обучения видов деятельности человека
В роботехнике и искусственном интеллекте есть трудная проблема. Она называется «обучение на однократном опыте». Как учатся машины? Они обычно анализируют большие объемы данных, постепенно оптимизируя свои действия и знания, пока не приходят к решению. Но такие объемы данных еще надо собрать, да и обучение — тоже происходит не вдруг. А человек может научиться определенному действию, увидев его всего один раз. Например, если человеку показать, как закрыть кран, ему не понадобится еще миллион раз это повторять. Человек просто знает, как это делать.
Домашнее хозяйство — это крайне непростая сфера деятельности человека. Здесь таких моментов «обучения на однократном опыте» — очень много. Заранее запрограммировать все необходимые действия и навыки — тоже очень трудно. Каждый дом — уникален. А ведь мы хотим, чтобы робот стал домашним помощником.
Робот наблюдал, как Шихар Бахл, робототехник из Университета Карнеги-Меллон открывает дверцу холодильника. Робот записал его движения, местонахождение холодильника, поворот двери, форму ручки и многое другое, проанализировал эти данные и приготовился повторить то, что сделал ученый.
Сначала робот ошибался: пропускал ручку, брался за нее не в том месте или дергал не в ту сторону. Но после нескольких часов практики роботу удалось открыть дверь.
Игра в имитацию
Шихар Бахл с коллегами разрабатывает новый метод обучения роботов под названием WHIRL (Wild Human Imitating Robot Learning — система имитационного обучения роботов в естественной среде).
WHIRL — это алгоритм однократной визуальной имитации.
С помощью WHIRL робот наблюдает за действиями людей и собирает видеоданные, которые ему необходимы, чтобы в конечном счете определить, как выполнить работу самостоятельно. Команда обучила робота выполнять более 20 задач — открывать и закрывать двери, выдвигать и задвигать ящики стола, накрывать крышкой кастрюлю, передвигать стул, даже складывать рубашку. Каждый раз робот сначала наблюдал, как человек выполняет задание, а затем практиковался и учился выполнять задание самостоятельно.
Современные методы обучения роботов обычно основаны на обучении с подкреплением. При обучении с подкреплением робота обучают на миллионах примеров, а затем робот адаптирует свои навыки к реальному миру. Модель хорошо работает при обучении робота одной задаче в структурированной среде, но ее сложно масштабировать и развертывать. WHIRL может учиться на любом видео человека. Модель не ограничивается одной конкретной задачей и может работать в реальных домашних условиях.
Первые несколько попыток робота выполнить задачу обычно заканчиваются неудачей, но как только он добился успеха, он быстро понимает, как ему действовать. Трудность еще и в том, что у людей и роботов разные возможности, они двигаются по-разному. Робот должен не воспроизводить движение человека, а понять и выполнить поставленную задачу: дверь открыта, свет выключен, кран закрыт.
Когда мы говорим, что человек умеет учиться на «однократном опыте», мы немного лукавим. Человек может в памяти воспроизводить увиденное действие многократно — и это тоже процесс обучения. Вот так и учится робот, созданный командой Шихара Бахла.