Роботы начали обобщать: робот от Physical Intelligence осваивает новые задачи без обучения

Стартап Physical Intelligence из Сан-Франциско представил модель π0.7, которая позволяет роботам выполнять задачи, на которых они не обучались. Это может стать шагом к созданию универсального роботизированного интеллекта. Модель демонстрирует ранние признаки генерализации — способности комбинировать навыки из разных контекстов для решения новых задач.

π0.7 представляет собой значительный шаг вперёд по сравнению с традиционными подходами к обучению роботов, которые основывались на запоминании конкретных задач. Теперь роботы могут использовать фрагменты данных из разных источников для выполнения новых действий. Например, в одном из экспериментов робот смог использовать фритюрницу, хотя в обучающем наборе данных было лишь два эпизода, связанных с этим устройством. С пошаговыми инструкциями робот успешно приготовил сладкий картофель.

Фото: Physical Intelligence

«Как только модель переходит от выполнения строго заданных задач к комбинированию навыков, ее возможности начинают расти быстрее, чем объем данных», — отметил Сергей Левин, сооснователь Physical Intelligence и профессор Калифорнийского университета в Беркли. Это свойство напоминает прогресс в области языковых и визуальных моделей.

Разработчики подчёркивают, что модель пока что не способна выполнять сложные многошаговые задачи без инструкций. Например, робот не может самостоятельно приготовить тосты, но с пошаговыми указаниями справляется. Это открывает перспективы для использования роботов в новых средах без необходимости дополнительного обучения.

Команда также признала, что стандартизированных метрик для оценки генерализации в робототехнике пока что не существует, что затрудняет внешнюю проверку их результатов. Тем не менее, модель π0.7 показала сопоставимые результаты с предыдущими специализированными моделями компании, выполняя такие задачи, как приготовление кофе, складывание белья и сборка коробок.

Physical Intelligence уже привлекла более $1 млрд инвестиций и оценивается в $5,6 млрд. Компания планирует новый раунд финансирования, который может удвоить ее оценку до $11 млрд. Несмотря на это, стартап пока не раскрывает сроки коммерциализации своей технологии.

©  iXBT