Новый фреймворк упростит имитационное обучение в робототехнике
Как сообщает издание Tech Xplore, разработчики из Нью-Йоркского университета создали новую платформу, которая сделает процесс обучения роботов быстрым и комфортным. На данный момент фреймворк использовали только для простых задач. В планах ученых — изучить стратегии, которые позволят роботам выполнять более сложные задачи.
Чтобы роботы могли выполнять различные рабочие и бытовые задания, их нужно этому научить. Одной из популярных стратегий обучения искусственного интеллекта является имитационное обучение. Во время него роботу демонстрируют видео и людей, которые занимаются той или иной деятельностью. Это очень эффективная методика, однако, для нее нужны большие массивы данных, содержащие видеоролики.
Ученые из Нью-Йоркского университета придумали, как организовать имитационное обучение без больших наборов данных. Для этого они разделили его на два модуля: изучение визуальных образов и связанных с ними действий.
«Мы хотели упростить имитационное обучение, — прокомментировал исследователь Джио Пари. — Имитационное обучение требует изучения видео и того, как можно использовать увиденные действия для выполнения задачи. Мы хотели разделить два этих компонента и понять роль и значение каждого из них».
Новый фреймворк позволяет сфокусироваться на процессе, благодаря которому роботы учатся находить в видео те функции, которые будут важны для выполнения задачи.
«Мы использовали методы самоконтролируемого обучения, — дополнил Джио Пари. — Во время него искусственный интеллект берет набор изображений и самостоятельно извлекает из него нужные функции. Это помогает научить роботов копировать действия с аналогичных изображений».
С помощью новой стратегии имитационного обучения можно увеличить эффективность визуальных имитационных моделей. Во время эксперимента ученым удалось научить робота открывать дверь после изучения аналогичных изображений. В будущем фреймворк может упростить процессы имитационного обучения в робототехнике, что приведет к их более быстрому распространению. Также в планах ученых — упростить обучение роботов выполнению комплекса действий, а не каждого движения в отдельности.
Полный текст статьи читайте на Компьютерра