AutoGPT: личный ИИ ассистент, решает задачи за человека. Попробовала — делюсь результатами
Всем привет!
Twitter взорвался от сообщений. АвтоGPT сам заказывает пиццу. АвтоGPT заменил целый отдел продаж: находит лиц, принимающих решения, отправляет им письма и назначает встречи в календаре. AutoGPT написал сайт.
«ChatGPT — это уже прошлое» — именно такое заявление распространено среди энтузиастов ИИ. АвтоGPT может заменить целые команды. Может быть личным ассистентом: ставлю цель, ухожу пить чай — прихожу — задача готова.
Я проверила — установила его к себе на компьютер и ниже делюсь результатами.
В чем отличие AutoGPT от ChatGPT?
Вообще AutoGPT это приложение Python с открытым исходным кодом, разработанное Significant Gravitas и размещенное на GitHub 30 марта 2023 года, работает на основе GPT-4 или ChatGPT. От ChatGPT имеет ряд отличий.
1 — AutoGPT работает автономно, без участия человека
ChatGPT просто предоставляет информацию и с ним нужно плотно работать, чтобы завершить задачу, он требует подсказок человека, при этом как правило ставить нужно очень узкую задачу.
AutoGPT работает автономно без участия человека, он не нуждается в подсказках, как ChatGPT. Можно поставить цель, он сам разобьет ее на подзадачи и будет работать до тех пор, пока не выполнит цель, попутно решая проблемы, которые будут вставать у него на пути.
2 — AutoGPT может «ходить» по вашему компьютеру
AutoGPT имеет возможность чтения/записи файлов, он может «ходить» по вашему компьютеру. Если для выполнения какой-нибудь задачи ему понадобиться ПО, которого нет у вас на компьютере — он его установит и продолжит работу над задачей.
3 — AutoGPT имеет доступ в интернет
AutoGPT имеет доступ в Интернет, поэтому от него можно получать актуальную информацию хоть на текущий день. В отличии от ChatGPT, который (как он сам и пишет на главной странице) имеет ограниченное знание мира и событий после 2021 года.
Примеры использования AutoGPT
В социальных сетях делятся примерами использования AutoGPT.
Например, пользователь Barsee заказал пиццу в Pizza Dominos с помощью AutoGPT. Точнее заказывал AutoGPT — начиная от выбора пиццы и заканчивая заполнением формы и нажатием на кнопку «Заказать», а Barsee просто наблюдал.
Некоторые издания пишут, что если вы дадите AutoGPT доступ к вашей кредитной карте, он может совершать покупки от вашего имени.
Еще один гик использовал AutoGPT для отдела продаж. AutoGPT определил 50 ведущих компаний, определил директоров по персоналу этих компаний, отправил им электронные письма и для тех, кто ответил, назначил встречи в календаре.
Также AutoGPT написал веб-сайт, попутно устанавливая на компьютер все необходимое ПО, которое не было установлено.
В СМИ пишут, что AutoGPT — это не просто языковая модель, а революционный инструмент, который может (и, вероятно, произведет) революцию в том, как люди ведут бизнес и работают.
Тестирую AutoGPT в командной строке
Можно использовать AutoGPT через браузер и через командную строку.
Если вы обладаете даже минимальными знаниями, то сможете самостоятельно по инструкции настроить AutoGPT на ваш компьютер и использовать его через командную строку. Я настроила буквально за 1 час по инструкции (файлы, инструкция).
Для установки вам понадобится API OpenAI, Python 3.10 или более поздняя версия, Docker, VSCode + devcontainer.
Как работает AutoGPT?
Вы ставите AutoGPT задачу, а он разбивает ее на подзадачи. Далее поочередно приступает к выполнению каждой подзадачи. В процессе выполнения у него возникают проблемы (например, на вашем компьютере не установлено нужное ПО для решения задачи), эти проблемы он решает (например, устанавливает ПО) и продолжает выполнять подзадачи.
Вот так все это выглядит в командной строке. Вам просто нужно задать цель. Желательно описывать также максимально подробно, как и ChatGPT. Пока работает только на английском.
Чтобы гарантировать, что проект выполняется в соответствии с ожиданиями пользователя, Auto-GPT будет запрашивать разрешение после каждого шага. Но если вы доверяете, то можно настроить и так, чтобы не запрашивал, поставить цель, уйти гулять, прийти и получить готовый результат.
Далее я попрошу AutoGPT решить 3 задачи и посмотрим, как он с этим справится.
Первая задача: прошу выбрать самые популярные новости, касающиеся аналитики данных за 8 мая 2023 года и на их основе составить текст подкаста на 5 минут.
Мы помним, что ChatGPT не обладает актуальными знаниями, после 2021 года у него ограниченное знание мира и событий. AutoGPT подключен к интернету и может взаимодействовать с ним в режиме реального времени.
Мы вводим нашу цель/задачу, AutoGPT думает и выдает нам список подзадач, которые нужно выполнить и которые собственного говоря он и будет далее выполнять.
Подзадачи, которые написал AutoGPT:
нужно использовать Google поиск чтобы найти релевантные новости
проанализировать популярность этих статей
определить самые популярные
создать текст подкаста на 5 минут, основываясь на этих новостях
После этого мы должны подтвердить, что согласны с планом.
AutoGPT выполняет первую задачу и после этого список задач немного видоизменяет, так будет после каждого решения подзадачи. От постановки цели до решения задачи может пройти достаточно большое количество времени, потому что в процессе выполнения могут возникать трудности, которые AutoGPT будет попутно решать.
Очень долго он производил разные манипуляции, собирал информацию, анализировал, потом опять собирал и опять анализировал (примерно около часа). Я решила, что дальше я не буду ждать (так как API все-таки платное) и попросила его остановиться и все-таки выдать текст.
И вот основываясь на самых популярных новостях, он создал небольшой текст подкаста.
Текст действительно основан на актуальных новостях (новости он сложил в отдельный файл), но его точно придется редактировать. С другой стороны, я остановила AutoGPT раньше, если бы это не сделала, возможно текст был бы лучше.
Также я попросила его дать самые популярные новости в России за 8 мая и получила действительно актуальные на эту дату.
Следующее задание для AutoGPT: прошу заказать пиццу на сайте Pizza Dominos. Для этого предоставлю все контактные данные, которые нужны для заказа и укажу пиццу, которую хочу получить.
Мне хотелось проверить, действительно ли можно заказывать еду с помощью AutoGPT (я бы заказывала с радостью).
И что мы видим? В данном случае AutoGPT не готов помочь и сразу об этом пишет: «Извините, но я не могу выполнить вашу просьбу, поскольку я являюсь моделью языка искусственного интеллекта и не имею возможности заказывать пиццу или совершать покупки.»
Вопрос, каким образом тогда удалось заказать пиццу другому пользователю — остается открытым. Мне не удалось найти, с помощью какой именно версии AutoGPT пользователь Twitter делал заказ, возможно это какое-то веб-приложение, либо нужны дополнительные настройки. Если вы знаете — напишите в комментариях.
И последняя более сложная, на мой взгляд, задача — прошу проанализировать данные.
В теории это может сделать и ChatGPT, но исходя из определений ChatGPT и AutoGPT, есть принципиальная разница:
ChatGPT не может читать файлы и у него нет доступа к файлам на компьютере, а AutoGPT может это делать и у него есть доступы.
ChatGPT может решить аналитическую задачу, напишет под нее код, но далее нужно будет пойти к себе на компьютер и реализовать код самостоятельно. В процессе могут возникать дополнительные проблемы и нужно будет снова обращаться к ChatGPT, самостоятельно пробовать и пробовать, пока не получится. AutoGPT теоретически может сделать все это самостоятельно, нам останется только смотреть и пить чай или вовсе уйти по своим делам.
Но по факту пришлось довольно долго помучаться. Пробовала давать ему файл, указывая, где этот файл находится на компьютере, но он долго не мог его найти. Потом нашел, но стал писать, что он слишком большой и все обнулялось. Также писал, что у меня на компьютере не установлен Pandas, хотя он был установлен, но видимо не в нужной ему директории, исправить это он так и не смог. И еще несколько других мелких проблем, которые AutoGPT не смог решить и зацикливался на проблеме снова и снова используя один и тот же метод решения, который не срабатывал.
Не получилось отдохнуть и вернуться к полностью решенной задаче.
В итоге анализ получился только тогда, когда я данные писала непосредственно в командную строку, тогда AutoGPT сделал какие-никакие выводы и написал скрипт на Python для визуализации. Но это совсем не то, что я просила и неудобно.
Тестирую веб версии AutoGPT
Также есть веб-версии AutoGPT — это AgentGPT и Gode Mode. Плюс в том, что не нужно ничего устанавливать на компьютер, но минусов довольно много. Веб-версии обрезают текст и это очень неудобно. Веб-версии не могут ходить по вашему компьютеру и делать в нем все, что вам нужно.
Заключение
Задач, которые я пыталась решить с помощью AutoGPT, было больше, потратила на это дня 2, но кроме решений задач с поиском актуальной информации, ни одно другое решение меня не удовлетворило.
Хотя возможно, что с версией GPT-4 AutoGPT будет работать лучше, у меня бесплатная версия и бесплатный тестовый период API.
Пока ИИ далек от выполнения сложных автономных задач без помощи человека. Идея AutoGPT замечательная, но на мой взгляд сырая. Он застревает на задачах, сталкивается с проблемами, которые не может обойти, имеет проблемы с пониманием контекста, тратит много времени на то, чтобы делать ненужные задачи и т.д. Тем не менее, использовать его наряду с ChatGPT я точно буду, а также буду внимательно следить за развитием.
Если вы уже пробовали AutoGPT — давайте пообщаемся в комментариях. Какие задачи удалось с его помощью автоматизировать?
Мои соц сети: Телеграм-канал по аналитике данных и технологиям | Канал на YouTube.