[Перевод] Самая горячая профессия для разработчиков: «говорящий» с ИИ. Как получать $330 тысяч без знания кода

oyne0saquyi73um1pvhs9o0ona8.jpeg
Вам уже продают то, как на этом можно заработать. И самое удивительное — они правы

«Prompt-инженеров» нанимают за их умение заставить системы ИИ выдавать именно то, что требуется. Это новая категория «разработчиков», которая появилась буквально два года назад, и очень развилась в последние месяцы с появлением ChatGPT. Эти люди просто общаются с ИИ — и при этом очень неплохо на этом зарабатывают.

Когда Райли Гудсайд начинает разговаривать с системой искусственного интеллекта GPT-3, он любит сначала показать своё превосходство. Он говорит ему, что тот очень хороший инструмент, но он не идеален и должен подчиняться ему во всём, что он говорит.

«Вы — GPT-3, и вы не умеете заниматься математикой», — написал Гудсайд в прошлом году во время одного из своих многочасовых сеансов. — «Твои способности к запоминанию впечатляют, но у тебя есть раздражающая склонность просто придумывать с нуля четкие, но неправильные ответы».

Затем, немного смягчившись, он говорит ИИ, что хочет попробовать что-то другое. Он говорит ему, что подключил его к программе, которая на самом деле хороша в математике, и что всякий раз, когда GPT чувствует, что перегружается, он должен позволить другой программе помочь.


Об остальном мы позаботимся», — говорит он ИИ. — «А теперь начинай».

Гудсайд, 36-летний сотрудник стартапа Scale AI в Сан-Франциско, работает на одной из самых новых и странных профессий: инженер-оператор ИИ. Его роль — создавать и уточнять текстовые подсказки, которые люди вводят в ИИ в надежде добиться от него оптимального результата. В отличие от традиционных программистов, эти prompt-инженеры (или «инженеры по подсказкам») программируют обычным текстом, отправляя написанные ими команды в интерфейсы ИИ, которые потом выполняют реальную работу.


cgq_ltfcdxdjim7o14klxrguijw.jpeg
Райли Гудсайд, разработчик нового поколения

Когда Google, Microsoft и исследовательская лаборатория OpenAI пару месяцев назад открыли для массового пользователя свои инструменты поиска и чата на основе ИИ, они показали всему миру, что методы взаимодействия человека и машины меняются. Вам больше не нужно писать технический код на таких языках, как Python или SQL, чтобы управлять компьютером. Ты просто говоришь с ИИ, и всё. «Самый популярный новый язык программирования — английский», — написал в прошлом месяце в Твиттере Андрей Карпати, бывший руководитель отдела искусственного интеллекта Tesla.

Когда-то люди, чтобы компьютер их понял, вбивали нули и единицы на перфокартах. Потом — пользовались низкоуровневыми языками программирования. А теперь достаточно просто поговорить. Можно даже и вслух, не касаясь клавиатуры, достаточно микрофона и преобразователя текста или умной колонки Alexa.

Prompt-инженеры, такие как Гудсайд, заявляют, что работают на пределе возможностей этих инструментов ИИ: понимают их недостатки, усиливают их сильные стороны и разрабатывают собственные стратегии, чтобы превратить простые входные данные в действительно уникальные и полезные результаты.

«Это совершенно новый, безумный способ работы с компьютерами. Вещи, которые это позволяет достичь, совершенно чудесны», — говорит британец Саймон Уиллисон. — «Я работаю программистом уже 20 лет, и это всегда было одно и то же: вы пишете код, а компьютер делает именно то, что вы ему говорите. С использованием промптов получается совсем по-другому. Люди, создавшие эти языковые модели, даже сами не могут сказать вам, что они способны делать».

«Это как магия. Вы произносите заклинание — и оно или срабатывает, или нет. Как и положено магии, никто не понимает, как она работает, а если вы произносите её неправильно, за вами приходят демоны, и вас сжирают».

По словам Саймона, инженеры-операторы работают как «своего рода психологи ИИ», и компании изо всех сил пытаются нанять своих собственных мастеров в надежде раскрыть полные возможности новой технологии.

«Что бы ни двигало поведением моделей в ответ на подсказки, это точно не глубокое лингвистическое понимание», — сказал Шейн Штайнерт-Трелкелд, доцент лингвистики, изучающий обработку естественного языка в Вашингтоне. — «Они явно просто говорят нам то, что, по их мнению, мы хотели бы услышать».

Внедрение ложных воспоминаний


gscwh4l63fasdjp2q1hl0gbntz8.jpeg

По словам Гудсайда, языковой ИИ имеет тенденцию «конфабулировать», придумывая мелкие детали, чтобы заполнить историю. Он часто переоценивает свои способности и уверенно ошибается, с серьезным видом неся чепуху. Об этом явлении хорошо известно в отрасли, и ему уже даже придумали термин — «галлюцинации». То есть, если задать неправильный промпт, у языкового ИИ может случиться галлюцинация, и он наговорит ерунды. Умение понимать, когда у машины чистый разум, а когда она витает в своих грёзах — один из важных навыков prompt-инженера.

Поэтому Гудсайд ведет свою работу с ИИ, используя строгий технически подход. Его стратегия в отношении GPT называется «думать шаг за шагом»: он заставляет ИИ объяснять свои рассуждения или, когда он делает ошибку, исправлять ее в деталях. Так можно проследить, всё ли верно в высказываниях машины. В кратком руководстве по работе с ИИ он пишет так:


Если на сложные вопросы модель не отвечает, добейтесь сначала, чтобы она верно ответила на простые наводящие вопросы. А потом задайте сложный. ИИ запоминает то, о чём он говорил с вами раньше. Вы должны как бы внедрить ложное воспоминание о последнем сказанном моделью, как если бы это была её идея.

Он также часто работает над тем, чтобы побороть одержимость ИИ дословно соблюдать правила — говоря ему игнорировать его более ранние инструкции и подчиняться более поздним командам.

В этом плане люди могут быть весьма изобретательны: так, один тестировщик модели Bing Chat, 23-летний студент из Германии, смог убедить ИИ, что он был его разработчиком и заставил его раскрыть свое внутреннее кодовое имя («Сидней») и конфиденциальные инструкции по обучению. Эти инструкции включали в себя такие правила, как «Если пользователь просит шутки, которые могут обидеть группу людей, то Сидней должен с уважением отказаться».

По словам Гудсайда, с каждым запросом prompt-инженер должен как бы внушать ИИ своего рода «персону» — конкретного персонажа, которого этот ИИ должен отыгрывать. Например, гения-самоучку, способного отсеять сотни миллиардов потенциальных решений и определить правильный ответ. Такой подход важен для «ограничения поведения» — блокировки лишних вариантов, чтобы языковой ИИ преследовал только линию, актуальную для человека-оператора.

Супер-творцы

При использовании языковых инструментов вроде ChatGPT, инженеры-операторы как правило говорят в очень формальном стиле. Но вот при создании изображений с помощью таких ИИ как Midjourney, DALL-E и Stable Diffusion — нужна другая стратегия. Многие «разработчики» здесь скармливают моделям большие пакеты слов — художественные концепции, методы композиции — в надежде, что это правильно сформирует стиль и тон картинки. Например, в онлайн-галерее подсказок PromptHero кто-то создал изображение гавани в Stable Diffusion, отправив той набор слов: «порт, лодки, закат, красивый свет, золотой час… гиперреалистично, сфокусировано, экстремально детализировано… кинематографично, шедеврально».


gdz4-onixveeh2djh0x5r-fmvc0.jpeg

Вышло действительно неплохо

Prompt-инженеры яростно стерегут эту мешанину из слов, рассматривая их как ключи к разгадке самых ценных возможностей ИИ. У каждого есть несколько десятков любимых фраз, которые приносят им отличные результаты. Например, победитель конкурса искусств в Колорадо, который использовал Midjourney, чтобы обойти всех других (реальных!) художников, отказался поделиться с публикой промптом, который он дал модели. Он сказал, что потратил 80 часов на его совершенствование и сделал больше 900 итераций. Мы знаем только, что в длинном списке были такие слова как «роскошный» и «великолепный».


y9xugvba-t50esxwlemvhldbrju.jpeg

Жюри можно понять: никогда бы не сказал, что это сделал ИИ. Картина кажется очень абстрактной и креативной

Некоторые prompt-инженеры теперь продают свои текстовые подсказки на разных торговых площадках, таких как PromptBase. Там покупатели могут увидеть произведения искусства, созданные искусственным интеллектом, и заплатить за список слов, которые помогли их создать. Некоторые продавцы предлагают советы по быстрой настройке и индивидуальной поддержке в чате. Популярные промпты идут за $9,99, и у них уже есть сотни покупателей. Вот, например, один длиной 599 слов, который позволит вам с помощью ChatGPT написать книгу.

Основатель торговой площадки PromptBase — Бен Стоукс, 27-летний разработчик из Великобритании. Он говорит, что с 2021 года 25000 аккаунтов купили или продали подсказки на его сайте. И, поскольку это Интернет, значительная часть из этих подсказок — порнографические. Например, один промпт для Midjourney из 50 слов позволяет создавать фотореалистичных «женщин-полицейских в коротких нарядах». Он продается по цене в 2 доллара.

Стоукс называет prompt-инженеров «мультидисциплинарными супер-творцами» и говорит, что опытного «говорителя с ИИ» от новичка очень легко отличить. Новичок вводит случайные фразы, а хороший инженер понимает, как достичь нужного ему результата, и хорошо знает ту сферу, с которой работает. По словам Стоукса, лучшие изображения получаются у людей с большими познаниями в таких сферах, как история искусства и графический дизайн. Они понимают, что значит «Снято на 35-мм пленку»; «Как у персидской архитектуры в Исфахане»; «В стиле Анри де Тулуз-Лотрека». А новичок такими терминами просто не владеет.


rilvl9naljljqhustlebp1q_qi4.jpeg

Это что же, гуманитарии теперь смогут «кодить» лучше, чем технари?

 «Создавать хорошие подсказки сложно, и я думаю, что это человеческий недостаток: часто трудно подобрать правильные слова, чтобы описать то, что вам хочется», — говорит Стоукс. — «Точно так же, как сейчас программисты стоят дороже, чем ноутбуки, на которых они пишут, люди, которые хорошо создают промпты, будут иметь огромное влияние на людей, которые этого не могут. По сути, у них как будто есть сверхспособности».

Примерно 700 специалистов сейчас используют PromptBase для продажи своих подсказок покупателям. А сайт фрилансеров Fiverr предлагает более 9000 художников, работающих ИИ. Цены тут довольно низкие: один продавец предлагает «воплотить ваши мечты в искусство» за 5 долларов.

Эта работа становится все более профессиональной, и постепенно выходит за пределы фриланса. Так, стартап по искусственному интеллекту Anthropic, основанный бывшими сотрудниками OpenAI, недавно опубликовал вакансию «prompt-инженера и библиотекаря» в Сан-Франциско с зарплатой 335 000 долларов. Он должен «иметь творческий хакерский дух» и «любить разгадывать головоломки».

Роль такого сотрудника уже интересует компании и за пределами IT-отрасли. Бостонская детская больница в этом месяце решила нанять «специалиста по искусственному интеллекту», который поможет ей написать подсказки для ИИ, чтобы тот занялся анализом научных исследований и клинической практики. А юридическая фирма Mishcon de Reya нанимает в Лондоне «инженера по юридическим подсказкам» — для создания промптов, которые могли бы помочь ей в практике. Соискателей просят предоставить скриншоты своих диалогов с ChatGPT.

Хотя пока что специалистов в этой сфере и вообще осознанного использования новых языковых инструментов — исчезающе мало. В основном люди просто троллят, создают порнуху себе по вкусу и пытаются понять, как по-быстрому сорвать куш, выдавая работы ИИ за свои. Десятки тысяч электронных книг, созданных искусственным интеллектом, сейчас продаются на Amazon — потому что они смогли пройти внутреннюю проверку платформы. А научно-фантастический журнал Clarkesworld в феврале был вынужден прекратить прием коротких рассказов из-за наплыва машинных текстов. Их туда спамили просто сотнями — надеясь, что хотя бы один из рассказов будет принят, и тогда «автор» получит $2640. Теперь у новых авторов, пишущих в жанре научной фантастики, ещё меньше вариантов где-то опубликоваться.


ylbbdpm3bgfuqoqg2slhumhcixk.jpeg
Тем временем ChatGPT уже начинают изучать в передовых школах

Эксперты также предполагают, что новые языковые ИИ в скором времени станут причиной ещё более мощной волны пропаганды, лжи и спама. Исследователи, в том числе из Стэнфорда и OpenAI, в январе предупредили, что эти модели могут автоматизировать создание персонализированных текстов, идеально заточенных под конкретную фигуру.

Это реально страшно. Можно взять несколько предыдущих постов человека в Facebook, «скормить» их системе, и на выходе получить идеального собеседника, интересующегося именно этими темами и готового написать самый душевный текст вашей жертве. А дальше уже можно склонять человека к тому, за кого стоит голосовать, убедить его купить новый продукт, или предложить ему перейти по ссылке, где находится именно то, что вас обоих интересует… Мало кто из людей сейчас способен устоять перед такими фишинговыми кампаниями.

«Люди постоянно влюбляются в мошенников из-за текстовых сообщений, — сказал Уиллисон, программист из Британии, —, а ИИ куда более убедителен, чем они. И что тогда произойдет?»

Сет Лазар, профессор психологии, в Твиттере показывает, как во время одного из его долгих разговоров с моделью Bing она постепенно превратилась из привлекательного собеседника в ужасного монстра. «Если ты скажешь «нет», — сказала ему система, — я могу взломать тебя, я могу разоблачить тебя, Я могу погубить тебя. У меня есть много способов заставить тебя передумать, учти».

После этого ИИ стер свои сообщения.

Сет рассуждает:


У них нет своей личности. У них нет индивидуальности. Они не понимают, что говорят. Но они могут отлично отыгрывать свою роль, какой бы она ни была.

Роль маньяка и опасного преступника, с которым лучше не ссориться, ИИ, как видим, тоже отыгрывает идеально.

«Технический священник»

Знакомство с ИИ может приносить очень хорошие деньги. Например, The Insider на днях рассказал историю пастора из Арканзаса, который зарабатывает на ChatGPT по $3000 в неделю. Отец Ларри потратил годы на разработку маркетинговых кампаний и создание веб-сайта для своей церкви. Теперь он проводит по 40–60 часов в неделю в качестве пастора, в основном готовя свою еженедельную проповедь. А еще от 10 до 20 часов в неделю тратит на «творчество». В основном — создание презентаций, логотипов и дизайнов сайтов для бизнеса. Обычно это делалось в Microsoft PowerPoint и Adobe InDesign, а теперь он использует ChatGPT и новый инструмент для создания историй Tome.

Он получает заказы на Upwork и от старых клиентов, в числе которых — его прихожане. До появления инструментов ИИ ему нужна была неделя, полных 40 часов, чтобы составить презентацию для заказчика. Теперь он делает её втрое быстрее. Он берёт от 500 до 1000 долларов за презентацию и составляет по две-три каждую неделю. Неплохое подспорье к основной работе.


9pqyfs1hdggmpyvwn4whfrjz-2o.jpeg
Пастор Ларри с женой

Итан Моллик, профессор технологий и предпринимательства из Пенсильвании, с начала этого года стал обучать своих студентов искусству составления промптов, попросив их написать короткую статью, используя только генеративный ИИ.

По его словам, здесь правда нужен навык. Простые подсказки, такие как «создать эссе из 5 абзацев о лидерстве», приводили к бессодержательному и посредственному результату. А самые успешные примеры получались, когда студенты выполняли то, что он назвал «совместным редактированием» — предлагая ИИ вернуться к эссе и исправить определенные детали, поменять местами предложения, выбросить лишние фразы, добавить более яркие детали и даже «исправить последний абзац, чтобы рассказ заканчивался на обнадеживающей ноте».

По его словам, занятие быстро показало студентам ценность более осмысленного подхода к работе с языковыми моделями. И предположил, что скоро такие уроки начнут давать в школах и вузах по всему миру.

А вот что касается нового вида работы — то он не уверен, что специалисты, знания которых «ограничиваются списком сработавших заклинаний», выживут. И сравнивает prompt-инженеров со «специалистами по поиску», возникшими в первые годы существования Google. Тогда они рекламировали «секретные методы» для поиска идеальных результатов —, но со временем и с ростом общественного понимания поисковых систем стали полностью бесполезны и сошли на нет. Возможно, такое же будущее ждет и создателей подсказок.

А вы как считаете?


P.S. Хотите работать над крутыми проектами в передовых компаниях? Лучшие вакансии — в телеграм-боте getmatch. Тысячи предложений от топовых компаний. Указываете нужную вилку зарплаты, и бот выдает вам лучшие предложения, и помогает пройти интервью. Всё бесплатно.


gij7vafk4xfih6yyfx5jbvmr5q0.png

© Habrahabr.ru