Учёные создали цифровое общество Agentopia из 100 агентов

Международная группа учёных под руководством специалистов Университета Фудань (Fudan University, Китай) представила систему Agentopia — крупнейший на сегодняшний день эксперимент долгосрочного социального моделирования для искусственного интеллекта. В отличие от предыдущих проектов, где виртуальные агенты существовали лишь несколько дней, новая платформа позволяет сотне ИИ-персонажей проживать полноценную жизнь, строить карьеру, дружеские отношения, переживать «эмоциональное выгорание» и даже менять собственные жизненные ценности. Авторы утверждают, что такой «социальный опыт» делает модели более «человечными» и улучшает их способности к ролевому взаимодействию.

Работа стала попыткой решить одну из наиболее обсуждаемых проблем современной индустрии искусственного интеллекта — постепенное истощение доступных данных для обучения больших языковых моделей. Исследователи предлагают альтернативный подход: вместо бесконечного чтения текстов модели должны приобретать собственный опыт, взаимодействуя друг с другом внутри сложных социальных систем.

В основе Agentopia лежит идея создания полноценного цифрового общества. В эксперименте участвовали 100 автономных агентов, каждый из которых обладал собственной биографией, чертами личности, талантами, воспоминаниями и жизненными целями. Симуляция охватывала период в 10 виртуальных лет, разбитых на недельные циклы. За это время агенты планировали своё будущее, искали работу, заводили знакомства, организовывали встречи, приобретали навыки и анализировали последствия собственных решений.

Изображение сгенерировано: Nano Banana

Для проверки универсальности подхода учёные создали три принципиально разных мира: современный городской жилой комплекс Apartment, школьную среду Campus и фантастическую Arcane Academy — своеобразную магическую академию. Во всех случаях агенты демонстрировали сложные формы поведения, которые не были заранее запрограммированы разработчиками.

Ключевой особенностью проекта стала система оценки, получившая название Life Reward («жизненное вознаграждение»). Вместо традиционных критериев успешности ИИ-модель оценивалась по трём показателям, близким к человеческим представлениям о благополучии: социальному статусу, субъективному ощущению счастья и материальному достатку. По сути, учёные впервые попытались научить ИИ стремиться не к выполнению отдельных задач, а к «хорошей жизни».

Для оценки социального положения исследователи использовали модифицированный алгоритм PageRank — тот самый математический метод, который когда-то применялся для ранжирования веб-страниц. Однако в Agentopia он анализировал не ссылки между сайтами, а отношения между агентами, разделяя их на два независимых типа: личную симпатию и профессиональное уважение. Такой подход позволил моделировать ситуации, хорошо знакомые людям: например, когда человека считают выдающимся специалистом, но не испытывают к нему особой личной привязанности.

Результаты экспериментов показали, что внутри цифровых обществ начали возникать сложные социальные явления. Некоторые агенты становились своеобразными «социальными архитекторами», знакомя между собой других персонажей и формируя устойчивые сообщества. Другие сталкивались с профессиональным выгоранием из-за чрезмерной социальной активности. Были зафиксированы случаи осознанной смены высокооплачиваемой профессии на менее доходную, но более удовлетворяющую психологические потребности. Некоторые агенты самостоятельно создавали многолетние личные ритуалы и привычки, которые постепенно становились частью их идентичности.

Также обнаружился интересный конфликт между стремлением к успеху и субъективным благополучием. Агенты, ориентированные на карьеру и накопление ресурсов, в среднем достигали более высоких доходов, но значительно чаще испытывали неудовлетворённость жизнью. Напротив, персонажи, уделявшие больше внимания социальным отношениям, демонстрировали более высокий уровень психологического благополучия.

Наиболее важным результатом стало то, что накопленный в симуляции опыт оказался полезен и за пределами виртуального мира. После дополнительного обучения на основе собственных жизненных историй модели улучшили качество ролевого взаимодействия на 15,6% по тесту CoSER (Character-of-Situation Acting), который оценивает способность искусственного интеллекта воспроизводить сложные человеческие характеры. Показатели антропоморфности — степени сходства поведения ИИ с человеческим — выросли ещё сильнее, на 23,7%.

Авторы подчёркивают, что их работа выходит далеко за рамки создания очередного симулятора наподобие The Sims. По их мнению, Agentopia демонстрирует принципиально новый путь развития искусственного интеллекта, при котором модели смогут приобретать знания и социальные навыки через собственный опыт, а не только через анализ человеческих текстов. Если эта концепция подтвердит свою эффективность в дальнейшем, то обучение через виртуальную жизнь может стать одним из ключевых направлений развития ИИ в эпоху после исчерпания традиционных данных для обучения.

©  iXBT