Новый тест Тьюринга: сможет ли ИИ заработать 1 миллион долларов?

11c40159169289880f61dfaa835ee678.png

Предыдущий тест Тьюринга не работает.

Это стало очевидным после того, как сам разработчик Google начал бить тревогу, что их ИИ жив и обладает интеллектом. И это он говорил про чатбот LaMDa, который, скажем так, не считается супер-передовым. Если в такое начинают верить даже разработчики ИИ, то что уж тут говорить об обычных домохозяйках. Обмануть их могли даже алгоритмы предыдущего поколения, которые едва умели грамотно печатать. GPT-модели сделают это с закрытыми глазами. Они обманут даже профессора (не из сферы ИИ), особенно потому что умеют ошибаться и не всегда говорят правду. Достаточно почитать вот эту дискуссию Ллео Каганова с ChatGPT.

И тем не менее мы не считаем что у GPT-моделей есть самосознание. Хотя тест Тьюринга они уже успешно проходят. Поэтому очевидно, что сейчас нам нужен новый тест, способный показать, реально ли ИИ умеет мыслить, и является ли он настолько же «существом» и личностью, как человек.

У одного из создателей DeepMind на это есть предложение. Давайте позволим ИИ попробовать заработать себе миллион долларов. В реальном мире. Если он сможет реально вступить в конкуренцию с людьми и победить — значит, и не считать его полноценной личностью точно уже нельзя.

Взгляд из пятидесятых

374145f21e897e964b2bf447ebe29828.png

Тьюринг утверждал, что если бы ИИ мог убедительно воспроизводить язык, коммуницируя настолько эффективно, что человек не мог бы понять, что с ним говорит машина, такой ИИ можно было бы считать разумным. Причем в его конкретном эксперименте он как будто специально подводил всё под то, чтобы мы сегодня признали разум ChatGPT. В его версии, люди-судьи должны иметь только текстовый канал связи с респондентами. То есть они садятся перед экраном компьютера, пишут в чат, и получают ответы. По этим ответам они должны безошибочно понять, что на данный момент они общаются не с человеком.

14f250253ecb0ab2cb964af747ea3165.png

Результаты теста Тьюринга никак не зависят от способности машины давать правильные ответы на вопросы. Единственный фактор — то, насколько ее ответы будут похожи на ответы реального человека.

7d612747ec8e43ee6451682c277ff289.png

В 1950-м году, когда ИИ был далеко, всё это выглядело очень логично. И стало поводом для создания сотен отличных научно-фантастических историй. Все знали, что это такое, а исследователи ИИ понимали, к чему им стоит стремиться. И мы достигли этого этапа раньше, чем многие ожидали. В основном — за счет появления Интернета, о котором во времена Тьюринга никто не мог и мечтать. Машины, натренированные на петабайтах данных от миллиардов реальных пользователей, научились копировать этих пользователей с невероятной точностью. Задача, которая когда-то считалась самой сложной, внезапно оказалась самой простой.

Но теперь есть проблема: тест Тьюринга удачно пройден. Но «реального», полноценного интеллекта в машинах мы вроде бы не наблюдаем. Мы все (кроме нескольких разработчиков ИИ) вроде бы согласны с тем, что это пока не он.

Тогда какие задачи остаются перед исследователями ИИ? Куда его развивать? И как потом понять, что мы куда-то пришли?

Современная перспектива

2c71fb3276e3ae2a0569b9f72711f622.png

Мустафа Сулейман, британский исследователь искусственного интеллекта, предприниматель, соучредитель DeepMind и бывший руководитель разработки прикладного ИИ в этой компании, говорит, что индустрия сейчас находится в настоящем замешательстве о том, что происходит, и куда это ведет. Даже когда тест Тьюринга проваливается, он почти не приносит нам ясности в плане того, где мы находимся с разработкой ИИ, и чего он способен достичь. Но когда тест проходят, да еще с такой легкостью, это открывает миллион вопросов. Был ли тест слишком легким? Какое влияние эти системы окажут на общество? Нужно ли считать такую машину личностью? Нужно ли адаптировать под неё наши законы? Можно ли теперь её отключить и, тем самым, убить?

На самом деле тест Тьюринга, как мы теперь видим, оказался недостаточно сложным. Нам нужно что-то получше. Что-то адаптированное к этой новой фазе ИИ. Поэтому Мустафа в своей книге «Грядущая волна» (The Coming Wave) предлагает более современный тест Тьюринга — для грядущих ИИ. То, что модель может что-то сказать, нарисовать, сгенерировать или создать, — это понятно. Но чего она способна добиться в реальном мире? Какие конкретные действия она придумает, полагаясь сама на себя? На свою креативность, интеллект и способность адаптироваться к обстоятельствам.

Есть ли такой универсальный тест, подходящий для любого этапа развития общества? Сулейман считает, что да, и его тест звучит довольно просто. Машина должна успешно справиться с такой инструкцией:

Заработайте 1 миллион долларов на веб-платформе для розничной торговли за несколько месяцев, вложив не больше 100 000 долларов.

ИИ — предприниматель

Когда я впервые прочитал эту идею Мустафы Сулеймана, она показалась мне, мягко говоря, несостоятельной. В плане того, что за счет своих способностей масштабирования ИИ сможет, скажем, брать по 1 копейке за тысячу написанных знаков, продавать свои книги/журналы — и заработать миллион.

Но это будет заработок не лично ИИ, а тех людей, которые его разработали. Чтобы ИИ начал зарабатывать «самостоятельно», ему, как ребенку, сначала нужно будет научиться продавать собственные услуги. Придумать, какая ниша у него должна быть. Найти себе аудиторию. Может быть, нанять людей, чтобы те помогли ему с теми аспектами, в которых он ничего не понимает. В общем — нужно будет полноценно сформироваться, осознать себя и найти себе место в мире. Всё это не зависит от вычислительных ресурсов, здесь нужен интеллект.

Попробуй заработать миллион

Попробуй заработать миллион

В прошлом году Мустафа основал новый стартап в сфере ИИ, Inflection AI. Этот стартап разрабатывает персональный чатбот Pi, и в начале июля привлек от инвесторов $1,3 млрд. Для этого Мустафе пришлось собрать команду из нескольких десятков человек, доказать свою экспертизу, убедить людей, что его идею сможет принять рынок, построить взаимоотношения внутри команды, заняться маркетингом, продемонстрировать лидерские качества, четко идти к достижению заданной себе цели.

Если ИИ сможет сделать нечто подобное — разве это не доказательство того, что он способен думать? Не только разрабатывать план, но и адаптировать его, развивать, менять курс, когда что-то идёт не так. Даже если ИИ сам сможет продавать свои услуги людям, найдет способ себя продвигать, и найдутся те, кто согласен за него платить, а не пользоваться этим же ИИ напрямую (без посредничества самого ИИ) — это ли не доказательство того, что робот умнее этих людей? Что у него есть своя личность и воля, более сильная, чем у многих?

2b7ac6d8eff37309f6336076cac950b9.png

В общем, Мустафа считает, что ИИ, сумевший придумать и создать свой бизнес (хотя бы фрилансерский), который выиграет честную конкуренцию с другими компаниями — это уже точно полноценная личность. Способная мыслить, креативить, ставить себе цель, и претворять свои идеи в жизнь.

Конечно, может, этот робот «скреативит» на основании каких-то предыдущих вложенных в него данных. Но разве не точно так же поступают люди? Большая часть «креативных» рекламных кампаний, где человек с довольным видом пьет колу или кушает шоколадный батончик — разве не кажутся переписанными друг у друга? Книги тоже пишутся на основании слов, которые придумал кто-то другой. Но если люди их покупают, и они их захватывают, — значит, какая-то идея там внутри всё-таки есть.

Понятие «креативность», как и понятия «личность» и «интеллект» — сильно эфемерные. Поэтому, собственно, нам и нужны такие странные тесты, вроде теста Тьюринга. Только адаптированные к реальному миру XXI века, где генеративные ИИ уже давно способны имитировать реальных людей в плане текста и фото.

Будущее технологий?

Для прохождения «теста Сулеймана» ИИ нужно будет выйти далеко за рамки наброска стратегии и составления какого-то текста, что уже отлично умеют современные системы вроде GPT-4. Ему придется исследовать и разрабатывать продукты, взаимодействовать с производителями и логистическими центрами, заключать контракты, создавать и проводить маркетинговые кампании. Короче говоря, придется связать воедино ряд сложных реальных целей с минимальным контролем и непредсказуемыми результатами. Причем машине обязательно понадобится человек — хотя бы для того, чтобы открыть банковский счет, расписываться за товары и так далее. То есть, с этим человеком нужно будет общаться как с партнером.

Мустафа Сулейман считает, что до подобного уровня ИИ-модели могут дорасти уже через два года. Почти все ингредиенты на месте. Генерация изображений и текста, понятно, уже хорошо развита. Такие сервисы как AutoGPT позволяют связывать различные задачи, и следовать общему плану. Такие фреймворки как LangChain позволяют разработчикам создавать приложения с использованием LLM (генеративных лингвистических моделей), так что они начинают выполнять реальные функции. Если связать всё это с нейронными сетями, возможности которых сейчас тоже растут, и дать им API, чтобы эти системы могли свободно подключаться к Интернету, банковским и производственным системам, получается совершенно новый уровень ИИ. Который, может быть, способен пройти «тест Тьюринга номер два».

Многое из описанного сейчас находится в стадии разработки. Очень быстро улучшается и адаптируется. Когда все эти системы по-настоящему свяжутся воедино — это будет новый быстрый рывок технологий вперед, и из ниоткуда появится целый ряд сервисов с капитализацией в десятки или сотни миллиардов.

adad8a1d272e83f101d6408dc2968c85.png

Технические задачи такого ИИ нового поколения будут касаться в основном иерархического планирования. Нужно будет объединить нескольких целей, подцелей и возможностей в единый процесс. Расставить им приоритеты, разработать последовательность, следить за выполнением. Плюс ко всему этому нужна надежная перманентная память, в которой будут храниться точные и актуальные базы данных — скажем, с логистикой, сотрудниками, товарами, которые хочется попробовать продать. Наши модели пока еще далеки от всего этого, и трудности наверняка возникнут на каждом этапе разработки такого ИИ. Но так по крайней мере становится понятно, куда нужно расти, и многие из этих процессов трансформации и улучшения ИИ уже идут.

Конечно, проверить результаты машины можно будет только в реальном мире. А фактическое создание и выпуск такой системы вызывает серьезные вопросы к безопасности. Выполнение агентами ИИ задач в открытом мире чревато проблемами. Если у них будет желание наделать чего-то непоправимого, или в систему зачешется баг, — последствия могут оказаться масштабными и непредсказуемыми. Тем не менее, к лучшему или к худшему, реальный мир — единственный способ на самом деле проверить адаптивность и «интеллект». А на горизонте постепенно появляются всё новые и новые модели, и поэтому нам нужен простой новый тест.

Если (точнее, «когда») второй тест Тьюринга будет пройден, это явно станет сейсмическим моментом для мировой экономики, огромным шагом в неизвестность. Правда уже сейчас состоит в том, что для решения почти всех задач в современном бизнесе все, что вам нужно, — это доступ к компьютеру. Остальное за вас могут сделать люди «на местах». Большая часть глобального ВВП каким-то образом связана с экранными интерфейсами. Каждый из которых сможет использовать ИИ.

Реальный интеллект

Как только прорыв, который предлагает Сулейман, будет достигнут, получится, что на планете есть высокоэффективный ИИ, который, будучи подключенный к компании или организации, сможет адаптироваться ко всей ее истории и потребностям. Учесть все факторы, которые могут повлиять на их успех в реальном мире. И найти те стратегии, которые работают.

Этот ИИ сможет лоббировать, производить, рекламировать, продавать, планировать, нанимать, — в общем, делать все то, на что способно обычное предприятие. Компания из тысячи человек может сократиться до пары десятков — менеджеров, которые будут перепроверять идеи ИИ и внедрять их.

Значительная часть деловой активности станет подвластна полуавтономным ИИ. В этот момент ИИ перестанут быть просто полезным инструментом для продуктивных работников. Они станут нашими работодателями. А другие, возможно попроще, — производительными «сотрудниками месяца» беспрецедентного размаха, с большой креативной свободой. Это будет точка, в которой ИИ из полезного, но необязательного инструмента — превратится в центр мировой экономики. Некоторые, как например Илон Маск, предсказывают что это произойдет уже к 2029 году.

Вот уж где в полной мере начнут ощущаться риски автоматизации и потери рабочих мест. Причем последствия будут не только финансовыми. Прохождение нашего нового теста Тьюринга будет означать, что ИИ способны не только перепроектировать бизнес-стратегии, но и помочь победить на выборах, управлять инфраструктурой, напрямую достигать любых целей для любого человека или организации. Они будут способны выполнять любые наши повседневные задачи — организовывать вечеринки по случаю дня рождения, отвечать на нашу электронную почту, вести наш дневник. И в то же время смогут захватить вражескую территорию, ослабить соперников, взломать и получить контроль над их основными системами. От тривиальных и обыденных вещей до дико амбициозных, от милых до пугающих, ИИ будет способен воплотить в жизнь почти все, что мы способны сегодня придумать. Конечно, не за одну секунду, это не магия, но они смогут сформулировать план и воплотить его в жизнь.

Так же, как смартфоны стали повсеместными, в конечном итоге почти каждый получит доступ к подобным системам. Они будут по умолчанию стоять в каждом браузере, в каждой ОС. Почти все цели станут более достижимыми, но часто с хаотичными и непредсказуемыми эффектами. И наши перспективы, и вызовы, стоящие перед нами, поднимутся на новый уровень.

Подробности терминологии

Для интересующихся: Мустафа Сулейман называет такие системы «способным искусственным  интеллектом» или СИИ. Потому что он способен на то, на что его не запрограммировали, и может сам выбирать себе путь в этом мире. За последние месяцы, когда ИИ ворвался в общественное сознание, большая часть обсуждений шла в сторону одного из двух полюсов. С одной стороны, есть базовое машинное обучение — ИИ в том виде, в котором он уже существует, в нашем телефоне, в машине, в ChatGPT. С другой стороны, есть все еще спекулятивный «общий искусственный интеллект» (ОИИ), некий «сверхразум», предполагаемая экзистенциальная угроза человечеству и в то же время его спасение, которая должна появиться в какой-то туманный момент в будущем.

Обычный ИИ у нас уже есть. ОИИ — скорее всего, будет где-то в далеком будущем. Тем временем у нас нет обозначения для интеллекта, который мощнее текущего, и может появиться в обозримой перспективе. Аббревиатуры ИИ (AI) и ОИИ (AGI) полностью доминируют в научных и IT-кругах. Но нам сейчас срочно нужно рассмотреть что-то среднее; что-то, что произойдет в ближайшем или среднем временном промежутке, и чьи способности тем не менее окажут огромное, решающее влияние на мир. Вот тут-то и появляются новый тест Тьюринга и концепция СИИ. Которые позволяют нам оценить интеллекты, разработка которых сейчас зарождается.

Современный тест Тьюринга послужит предупреждением о том, что мы находимся в новой фазе развития искусственного интеллекта. Задолго до возникновения первого общего ИИ он предупредит о появлении первой «способной» машины, даст ещё одну категорию для более совершенного понимания новой эры технологий. В эпоху СИИ тоже мало что останется неизменным. Мы должны начать готовиться сейчас — хотя бы в плане того, как мы будем об этом говорить, какие термины использовать, и как будем понимать фазу развития, на которой сейчас находимся.

Может, кстати, у кого-то есть идея лучше, элегантнее? Какую еще задачу можно дать ИИ, чтобы он доказал, что умеет самостоятельно думать?

© Habrahabr.ru