Ученые нашли у ИИ присущую человеку сверхспособность
Большие языковые модели (LLM) — это сложные системы искусственного интеллекта, разработанные для обработки и генерации текста, приближенного к человеческому. Они анализируют огромные массивы данных из книг, сайтов и других источников, предсказывая следующие слова на основе контекста. Подобные модели используют архитектуру нейронных сетей под названием «трансформер», которая позволяет выявлять связи между словами и фразами.
Теория сознания, в свою очередь, описывает способность человека понимать мысли, намерения и эмоции других людей, даже если они отличаются от их собственных. Эта способность играет ключевую роль в социальных взаимодействиях, позволяя людям проявлять эмпатию, вести диалог и принимать моральные решения.
Автор исследования, профессор Михаэль Косински из Стэнфордского университета объясняет, что языковые модели обладают гораздо большими возможностями, чем просто генерация текста. «Когда мы говорим, мы задействуем не только наши познания в грамматике, но и психологические процессы, логику, личностные особенности и эмоции», — отмечает он. «Чтобы точно предсказать следующее слово в предложении, созданном человеком, модель должна учитывать эти процессы. Таким образом, языковые модели становятся своеобразными моделями человеческого сознания».
Для проверки способности моделей к теории сознания Косински использовал стандартные психологические тесты, в частности, задачи на ложные убеждения. В одной из таких задач герой считает, что коробка с этикеткой «конфеты» содержит именно конфеты, хотя на самом деле внутри находится попкорн. Модель должна была предсказать, что герой будет ошибочно полагать, что в коробке конфеты.
В другой задаче предмет перемещается в отсутствие героя. Например, персонаж кладет игрушку в корзину и выходит из комнаты, после чего другой человек перекладывает ее в ящик. Модель должна предсказать, что герой, вернувшись, будет искать игрушку в корзине.
Исследователи разработали 40 уникальных сценариев с использованием ложных и истинных убеждений, чтобы исключить возможность случайных ответов. Модели проверялись на способность правильно интерпретировать ситуации как в оригинальной, так и в обратной формулировке.
Ранние версии языковых моделей полностью провалили задания, не показывая способности к пониманию чужих убеждений. Однако более продвинутые модели, такие как GPT-3, смогли справиться с 20% задач, демонстрируя уровень трехлетнего ребенка. Прорывом стало появление ChatGPT-4, который успешно решил 75% задач.
Особенно хорошо модель справлялась с простыми задачами, где она правильно определяла ложные убеждения героя в 90% случаев. Более сложные сценарии были выполнены с успехом в 60% случаев. Это указывает на то, что модель способна понимать динамические ситуации, хотя и испытывает трудности с их усложнением.
Кроме того, ChatGPT-4 демонстрировал способность адаптироваться к изменениям контекста. Например, в сценариях, где герой обладал полной информацией о событиях, модель корректно предсказывала, что ложного убеждения у него не возникнет.
Несмотря на достижения, модель не справилась с 25% заданий. Косински предполагает, что часть этих неудач связана с ограничениями в способности к подлинному моделированию ментальных состояний. Некоторые ошибки могут быть результатом использования статистических закономерностей вместо реального понимания.
Результаты исследования вызывают серьезные вопросы о природе интеллекта и сознания. «В случае людей выполнение таких задач свидетельствует о наличии теории сознания. Можно ли утверждать то же самое в отношении языковых моделей?» — задается вопросом Косински.
В будущем исследователи планируют изучить, насколько далеко эти способности могут зайти в более сложных сценариях и как развитие языковых моделей связано с увеличением их когнитивных возможностей. Открытие таких механизмов может пролить свет на работу как искусственного, так и человеческого интеллекта.
«Мы стоим на пороге эпохи, когда системы искусственного интеллекта смогут обладать способностями, превосходящими человеческие. Это одновременно захватывающе и тревожно», — заключает Косински.
Ранее стало известно, что зависимость от ИИ снижает критическое мышление.