Учёные создали ИИ, который обучается подобно ребёнку

В исследовательской лаборатории искусственного интеллекта DeepMind создали систему искусственного интеллекта PLATO (Physics Learning through Auto-encoding and Tracking Objects, «Обучение физике с помощью автоматического кодирования и отслеживания объектов»). Авторы разработки говорят, что она обучается подобно обычному ребёнку.

DepositphotosDepositphotos

Существующие ИИ-системы показывают высокие результаты при решении ряда задач, но в большинстве аспектов уступают людям. Например, даже дети инстинктивно понимают, что один объект, ненадолго оказывающийся позади другого, не исчезает. Однако это правило не было столь интуитивно понятным для ИИ. 

PLATO обучили с помощью серии закодированных видеороликов, предназначенных для представления тех же базовых знаний, которые младенцы получают в первые несколько месяцев жизни.

Примеры тестов для оценки физической концепции непрерывности / Nature Human BehaviourПримеры тестов для оценки физической концепции непрерывности / Nature Human Behaviour

«К счастью для нас, специалисты по психологии развития потратили десятилетия на изучение того, что младенцы знают о физическом мире, и каталогизацию различных концепций, которые входят в физическое понимание», — говорит нейробиолог Луис Пилото из исследовательской лаборатории DeepMind. — «Расширяя их работу, мы создали и открыли набор данных о физических концепциях. Этот синтетический набор видеоданных черпает вдохновение из оригинальных экспериментов по разработке для оценки физических концепций в наших моделях».

Есть три ключевых вещи, которые все понимаем с самого раннего возраста: постоянство (объекты не исчезают внезапно); твердость (твердые объекты не могут проходить друг сквозь друга); и непрерывность (объекты последовательно перемещаются в пространстве и времени).

Набор данных, созданный исследователями, охватывал эти три понятия, а также два дополнительных: неизменяемость (свойства объекта, такие как форма, не меняются); и направленная инерция (объекты движутся в соответствии с принципами инерции).

Примеры обучающих видео (реальное видео содержит 15 кадров) / Nature Human BehaviourПримеры обучающих видео (реальное видео содержит 15 кадров) / Nature Human Behaviour

Этому пониманию обучили PLATO через видеоролики с мячами, падающими на землю, отскакивающими друг от друга, исчезающими за другими объектами и затем вновь появляющимися, и так далее. 

Затем ИИ показали видеоролики с «невозможными» сценариями, противоречащими изученной им физике, и PLATO «выразил удивление».

PLATO состоит из двух компонентов: модуля восприятия (слева) и предиктора динамики (справа). Модуль восприятия используется для преобразования визуального ввода в набор кодов объектов. Модуль динамики состоит из двух обучаемых компонентов: LSTM на основе «слотов» и сети взаимодействия (IN). Прогнозы делаются путем вычисления взаимодействий каждого слота в предыдущем состоянии LSTM (пунктирная стрелка) с каждым другим слотом в LSTM и всеми кодами входных объектов и буферами z1:t1:K. Результирующее взаимодействие используется для объектных прогнозов и обновлений LSTM / Nature Human BehaviourPLATO состоит из двух компонентов: модуля восприятия (слева) и предиктора динамики (справа). Модуль восприятия используется для преобразования визуального ввода в набор кодов объектов. Модуль динамики состоит из двух обучаемых компонентов: LSTM на основе «слотов» и сети взаимодействия (IN). Прогнозы делаются путем вычисления взаимодействий каждого слота в предыдущем состоянии LSTM (пунктирная стрелка) с каждым другим слотом в LSTM и всеми кодами входных объектов и буферами z1: t1: K. Результирующее взаимодействие используется для объектных прогнозов и обновлений LSTM / Nature Human Behaviour

Это произошло и после относительно коротких периодов обучения, которые в некоторых случаях занимали всего 28 часов. С технической точки зрения, как и в исследованиях младенцев, учёные искали доказательства неоправданных ожиданий. Они показали, что ИИ понимал концепции, которым его учили.

Иллюстрация процедуры сращивания, используемой для создания пробного видео для физической концепции «неизменности» / Nature Human BehaviourИллюстрация процедуры сращивания, используемой для создания пробного видео для физической концепции «неизменности» / Nature Human Behaviour

«Наша объектно-ориентированная модель продемонстрировала устойчивые эффекты неоправданных ожиданий во всех пяти изученных нами концепциях, несмотря на то, что она была обучена на видеоданных, в которых конкретные события из тестирования не происходили», — говорят исследователи.

Верхние, средние ряды: сравнение объектно-ориентированной модели PLATO (зеленый) с базовыми моделями (синий). Внизу: покадровый анализ удивления показывает, что оно возрастает, когда происходящее на видео становится физически невозможным / Nature Human BehaviourВерхние, средние ряды: сравнение объектно-ориентированной модели PLATO (зеленый) с базовыми моделями (синий). Внизу: покадровый анализ удивления показывает, что оно возрастает, когда происходящее на видео становится физически невозможным / Nature Human Behaviour

Команда провела дополнительные тесты, на этот раз с использованием объектов, отличных от тех, что были в обучающих данных. Опять же, PLATO продемонстрировал чёткое понимание того, что должно и не должно происходить.

PLATO «выразил удивление» (слева) при тестировании на невидимых объектах и в тесте динамики без какого-либо переобучения / Nature Human BehaviourPLATO «выразил удивление» (слева) при тестировании на невидимых объектах и в тесте динамики без какого-либо переобучения / Nature Human Behaviour

Однако система пока даже не совсем соответствует уровню понимания трёхмесячного ребенка. Так, ИИ меньше «удивлялся», когда ему показывали сценарии без каких-либо объектов или когда модели тестирования были похожи на обучающие.

Более того, видео, на которых обучался PLATO, включали дополнительные данные, помогающие ему распознавать объекты и их движение в трёх измерениях.

«Наша работа по моделированию представляет собой доказательство того, что по крайней мере некоторые основные концепции интуитивной физики могут быть усвоены посредством визуального обучения», — отмечают исследователи. По их словам, «данные показывают, что у людей интуитивные физические знания появляются в раннем возрасте, но на них может влиять визуальный опыт».

© Habrahabr.ru