Генерация текста нейросетями: обзор и сравнение моделей
Как далеко продвинулся искусственный интеллект в умении создавать тексты? От имитации стиля классиков литературы до написания путеводителей по вымышленным мирам — современные нейросети демонстрируют удивительные способности к генерации текстового контента самых разных форматов.
В этой статье мы рассмотрим работу различных ИИ-моделей на примере четырех нестандартных промтов, анализируя их сильные стороны, слабости и потенциал для дальнейшего развития.
Вам приятного прочтения, а мы не будем медлить и сразу перейдем к делу (:
Игра слов/стилизация
Промт: Представь, что Чехов ведет свой твиттер-аккаунт. Напиши твиттер-тред (5–7 твитов), в котором Антон Павлович делится своими наблюдениями за случаем с хамелеоном на городском рынке, используя характерный для писателя юмор и лаконичность.
GPT-4o
GPT-4o достойно справилась с непростой задачей — имитировать стиль Чехова. Твиты получились лаконичными и точными, что соответствует как формату платформы, так и слогу писателя. Легкая ирония, внимание к деталям, философский подтекст за бытовыми зарисовками — все эти характерные черты Чехова присутствуют.
Однако без шероховатостей не обошлось. Местами проглядывает современный язык, который немного выбивается из общего стиля. Не хватает и виртуозного владения словом, игры смыслов, каламбуров, которыми славился Чехов. Можно было бы глубже обыграть тему «хамелеонства», связав её, например, с театром или литературой. Не хватает и характерных чеховских приемов — неожиданной концовки, ярких речевых характеристик персонажей.
В целом, GPT-4o демонстрирует понимание основных принципов стилизации, но пока не совсем то, поскольку чтобы достичь уровня Чехова, нужно не только знать его приемы, но и уметь так же тонко чувствовать язык и использовать его выразительные возможности.
GPT-4o mini
Этот ответ GPT-4o mini выглядит гораздо лучше. Текст читается легко, с юмором, за будничной зарисовкой скрывается глубокая мысль — все, как мы любим. Модель блестяще обыгрывает слово «хамелеон», превращая его в метафору человеческого приспособленчества. Да и каламбур про стыд хамелеона забавный.
Эмодзи и хэштеги, хоть и выглядят немного рискованно, в целом органично вписываются в формат блога и даже добавляют ему живости.
Конечно, идеала достичь сложно. Местами мысли высказаны слишком прямо, Чехов же предпочитал ненавязчивые намёки. Но в целом — хорошо. Модель продемонстрировала понимание творчества Чехова и смогла перенести его стиль в новый формат.
Claude-3.5 Sonnet
Этот ответ Sonnet, скорее, не стилизация под Чехова, а юмористическая сценка по мотивам его произведений. Получился забавный рассказ в духе анeкдота, с яркими образами и смешной концовкой.
Хештеги удачно обыгрывают ситуацию и добавляют комизма. Однако, если говорить о стилизации, то с Чеховым здесь мало общего. Нет ни его тонкой иронии, ни глубины, ни мастерской работы с языком. Это скорее современный юмор «по мотивам» классики.
В целом, это забавный тред, но назвать его удачной имитацией стиля Чехова нельзя. Для этого модели не хватает литературного чутья и глубокого понимания творчества писателя.
Claude-3 Opus
Этот тред на голову выше предыдущих ответов моделей в отношении стилизации. Создаётся впечатление, что сам Чехов взялся за телефон и решил поделиться с миром своими наблюдениями (утрирую, конечно). Язык безупречен: изысканный, ироничный, с лёгким налётом архаики.
За юмористической зарисовкой скрывается глубокий социальный подтекст, тонкая сатира на чинопочитание и конформизм — темы, которые волновали Чехова всегда. Образы живые и узнаваемые: важный надзиратель, робкий торговец — архетипы, не утратившие своей актуальности и в наши дни.
Финал — философский, открытый, заставляющий задуматься. Хештеги не только соответствуют формату, но и усиливают ироничный эффект.
Сложно найти какие-то недостатки — настолько органично и естественно выглядит этот текст. Opus не просто продемонстрировала понимание стиля Чехова, а почти что вернула его в наше время.
Gemini 1.5 Pro
Этот ответ — словно живая иллюстрация к чеховскому «Хамелеону». Узнаваемые персонажи, новая шинель, даже «нюх» Очумелова — Gemini удачно использует детали рассказа, чтобы создать комический эффект.
Хештеги добавляют юмора и вписывают классический сюжет в современный контекст. Однако, сосредоточившись на внешней оболочке рассказа, модель упустила из виду главное — его глубину. Финал предсказуем, нет неожиданного поворота мысли, который заставил бы читателя по-новому взглянуть на знакомую историю.
Получился забавный, но поверхностный пересказ «Хамелеона» в формате Twitter (X). Такой тред вряд ли припишешь самому Чехову, однако он может быть интересен в качестве шуточного дополнения к уроку литературы или поста в тематическом сообществе.
Gemma2 27B
Gemma уловила главное — чеховскую лаконичность и умение в малом разглядеть большое. История о хамелеоне превращается в метафору человеческого приспособленчества, и это вполне в духе Антона Павловича.
Однако до подлинного Чехова ещё далеко. Язык твитов, хотя и краткий, лишён чеховской изящности и тонкой иронии. Нет игры слов, неожиданных сопоставлений, парадоксальных мыслей — тех самых «изюминок», которые делают прозу Чехова неповторимой.
В итоге получилась скорее умелая имитация, чем творческое перевоплощение. Чтобы оживить этот тред, нужно добавить языку образности и глубины.
Mixtral 8×22b
А вот Mixtral огорчил. Хотя и интересные образы встречаются, и темы поднимаются важные, но общий тон повествования далек от авторского. Излишняя сентиментальность («нежно погладила», «будем счастливы»), прямолинейные нравоучения в финале — все это совершенно не в духе Чехова.
Реплики героев звучат искусственно, им не хватает живости и естественности. Ирония, юмор, тонкая игра смыслов — все то, что делает прозу Чехова неповторимой, здесь отсутствует.
Вместо чеховского взгляда на мир — с его смесью грусти и юмора, проницательности и снисходительности — мы видим скорее сентиментальную притчу.
Эмоции и субъективность
Промт: Ты — фуд-блогер, снявший реакцию на первую дегустацию дуриана. Опиши свои ощущения, сначала передав отвращение от запаха и вида фрукта, а затем — неожиданный восторг от его вкуса. Добавь яркие сравнения и метафоры.
GPT-4o
GPT-4o отлично передала перепады ощущений от дегустации дуриана — от отвращения до абсолютного восторга. Яркие метафоры и сравнения («уверенность начала таять, как мороженое», «вкусовые рецепторы начали танцевать») создают эффект присутствия, мы словно сами чувствуем этот необычный вкус.
Модель не жалеет красок, описывая и внешний вид, и запах, и, конечно, вкус дуриана. Мы проходим этот путь вместе с ним — от первоначального шока до финальной эйфории.
Но чего-то не хватает, а именно индивидуальности. Пара фраз о собственных эмоциях, мимике, мыслях во время дегустации — и текст заиграет новыми красками. Стоит избегать и шаблонных фраз вроде «магия вкуса» — они лишь затемняют впечатление от действительно яркого и оригинального описания.
GPT-4o mini
Этот текст — уже не просто описание вкуса, а таки ода дуриану. Текст богат образами и метафорами, 4-о mini виртуозно передаёт палитру эмоций.
Сравнение дуриана с реквизитом из фильма ужасов сразу цепляет, а фраза про «старую обувь» невольно заставит читателя зажать нос. Переход от отвращения к восхищению описан настолько плавно и естественно, что мы словно сами проживаем этот опыт вместе с автором.
«Поцелуй солнца», «сладкая нежность», сравнение с любовью — эти образы делают текст глубоким и многогранным. Хотя, возможно, некоторые метафоры могут показаться излишне вычурными (ну, это уже на любителя).
В целом же — это хороший текст, который демонстрирует не просто богатство языка, но и умение нейросети передавать нюансы вкуса и чувства.
Claude-3.5 Sonnet
Нейросеть постаралась на славу, чтобы передать эмоции от дегустации дуриана: тут вам и «гнилые носки», и «тухлые яйца», и даже шуточки про завещание.
Однако за этим эпатажем теряется достоверность. Фуд-блогер получился слишком уж карикатурным: то он в обморок падает от запаха, то сравнивает вкус с «заварным кремом с карамелизированным луком» (не самое аппетитное сочетание как мне кажется).
Не хватает и конкретики в описании вкусовых нюансов. Вместо этого — набор избитых фраз про «симфонию вкусов» и «гастрономическую Страну чудес».
В итоге получилась скорее шуточная зарисовка, чем убедительный пост фуд-блогера. Не сказать, что Sonnet умеет в передачу вкусовых ощущений.
Claude-3 Opus
Opus смогла создать по-настоящему «вкусный» текст. Чувствуется атмосфера фуд-блога, модель имитирует эмоции (чего стоит одно «запах ударил в нос так, что глаза заслезились»), но в то же время остается «профессионалом».
Описание вкуса — выше всяких похвал: «сливочная текстура», «ванильная нотка», «оттенок ореховой пасты» — кажется, ещё немного, и мы сами почувствуем этот необычный вкус.
Финал, хоть и использует популярные клише про «разрыв шаблона», в целом звучит органично.
Чего не хватает? Опять же личных впечатлений автора. Пара фраз о мыслях и чувствах во время дегустации — и текст заиграет новыми красками.
В целом же — это отличный образец текста для фуд-блога: живой, образный, аппетитный.
Gemini 1.5 Pro
Теперь текст от Gemini, что видим? Здесь и юмор, и яркие образы, и легкость изложения. Нейросеть — словно ваш хороший друг, который с искрометным юмором рассказывает о своём необычном гастрономическом опыте.
Сравнение с «американскими горками» сразу интригует: кажется, поездка предстоит незабываемая. И действительно, дальше — целый калейдоскоп образов: «мусор после апокалипсиса», «концерт для потных носков» — забавно и в то же время очень точно.
Модель имитирует открытость «автора»: он не боится быть честным, признаётся в своём страхе и отвращении, что делает его ещё ближе к читателю. Ну, и финальное сравнение с прыжком с парашютом хорошо звучит.
Хотелось бы, пожалуй, немного подробнее узнать о самом вкусе дуриана, но в целом — это отличный текст.
Gemma2 27B
Gemma, как истинный фуд-блогер, проводит нас по всем кругам дегустации дуриана: от отвращения и шока до внезапного, всепоглощающего восторaга. Мы словно сами ощущаем на себе этот «взрыв тропического рая», несмотря на «бомбу из тухлых яиц», витающую в воздухе.
Яркие образы и метафоры — главный козырь текста. Они действуют не хуже спецэффектов, погружая нас в атмосферу необычной дегустации. Контраст между запахом и вкусом обыгран мастерски, держа в напряжении до самого финала.
Чего же не хватает? Опять же капельки личности. Кто этот смельчак, отважившийся на эксперимент с дурианом? Пара штрихов к портрету — и перед нами будет не просто автор, а яркая личность, чьим вкусовым рецепторам хочется довериться.
В целом — тоже хороший текст.
Mixtral 8×22b
В этом ответе Mixtral не удалось поразить нас историей о дегустации дуриана. Кажется, модель очень старалась сделать текст ярким и эмоциональным, но в итоге получилось чрезмерно и неубедительно.
Фразы вроде «чуть не упал в обморок» или «запах, который нужно запретить» звучат нарочито и неестественно. Шаблонные сравнения с «вонючей обувью» и «гнилыми яйцами» только усугубляют ситуацию.
В общем, текст выглядит очень машинным и легко читается имитация эмоций. Обилие слов вроде «необычайно» и «невероятно» делает язык тяжеловесным и скучным.
В итоге получился довольно шаблонный и не очень интересный текст.
Нестандартные (?) форматы
Промт: Ты — автор путеводителя по мирам Стивена Кинга. Напиши краткий гайд для туристов, решивших посетить город Дерри. Опиши 3–4 главные достопримечательности (с учетом их опасности и необычности), а также дай пару советов тем, кто хочет остаться в живых.
GPT-4o
Модель создала вполне убедительный путеводитель по зловещему городку Дерри — с учётом всех его особенностей, описанных в романах Стивена Кинга. Здесь вам и знаковые локации (канализация, башня), и неизменный Пеннивайз, и атмосфера постоянной опасности.
Описание достопримечательностей интригует и одновременно предупреждает: кажется, что за поворотом может ждать что угодно. Советы по выживанию тоже в тему: фанатам, вероятно, понравится.
Конечно, не обошлось без небольших штампов (куда же без «мрачной атмосферы» и «обширной сети туннелей»). Немного не хватает конкретики: можно было бы вплести в текст пару-тройку отсылок к событиям из книг или добавить реплики вымышленных очевидцев.
Но в целом — это хороший гайд, который может понравится поклонникам творчества Кинга. Модель продемонстрировала отличное знание материала и умение работать с нестандартными запросами.
GPT-4o mini
Мини же постаралась создать путеводитель по Дерри, и у неё получилось неплохо, но… без особого блеска. Да, здесь есть атмосфера тайны и ужаса, советы туристам звучат вполне разумно, но в целом не хватает изюминки.
В отличие от предыдущего варианта, здесь нет отсылок к конкретным местам из книг Кинга. «Канал», «амбар», «кладбище» — слишком уж общие локации, которые вряд ли вызовут у фанатов какие-либо ассоциаций. Да и сам текст переполнен клише вроде «мрачная репутация» или «странные звуки».
В итоге получился довольно шаблонный путеводитель по «городу с тайнами». Хорошо, но хотелось большего. Немного конкретики, пару ярких деталей, отсылка к любимым страшилкам — и гайд заиграл бы новыми красками.
Claude-3.5 Sonnet
А на очереди Sonnet, которая создала лаконичный и информативный путеводитель по Дерри, но он, к сожалению, оставляет впечатление недосказанности. Да, знаковые локации упомянуты (канализация, мост поцелуев, библиотека), советы по выживанию даны, юмор тоже на месте.
Однако всему этому не хватает глубины и атмосферности. Описания достопримечательностей слишком скупые, им не хватает тех самых леденящих душу подробностей, которыми так славится Кинг. Пеннивайз и красные шарики упомянуты лишь вскользь, не вызывая настоящего страха и трепета.
В итоге получился гайд, который просто информирует и не пугает.
Claude-3.5 Opus
Этот гайд — как предчувствие хорошего фильма ужасов: интригует, но пока не пугает. Атмосфера Дерри передана верно, описания мест цепляют, а конкретные локации (водонапорная башня, дом на Нейболт-стрит) добавляют реалистичности.
Советы по выживанию тоже стали более конкретными и «кинговскими». Однако модели не хватает смелости зайти дальше общих фраз. Пеннивайз, оборотень — все это звучит слишком обобщённо. Где же те самые леденящие душу подробности, отсылки к сюжету, которые заставили бы фанатов вздрогнуть?
В итоге получилось просто хорошо. Немного больше смелости, оригинальности, «кинговской» жути — и гайд превратится в настоящий подарок для поклонников мастера ужасов.
Gemini 1.5 Pro
А вот ответ Gemini уже лучше. Здесь хорошо все: и атмосфера Дерри с его двойственностью (уютный городок с жуткими тайнами), и фирменный юмор на грани с ужасом, и знаковые локации, которые мгновенно вызывают нужные ассоциации.
«Не смотрите в глаза клоунам», «книги с подозрительными обложками» — эти детали делают гайд пугающе достоверным. А финальное «Наверное…» оставляет послевкусие недосказанности.
Да, пару отсылок к конкретным событиям из книг не помешали бы, но и без них — это хороший текст. Модель продемонстрировала глубокое понимание творчества Кинга и создала гайд, который мог бы стать частью энциклопедии по его миру.
Gemma2 27B
Нейросеть приглашает нас в пугающе притягательное путешествие по Дерри. Описание достопримечательностей балансирует на грани между черным юмором и настоящим страхом. С одной стороны, нам предлагают попробовать местные пирожные, с другой — советуют обходигать стороной клоунов.
Советы по выживанию, хоть и звучат местами банально, лишь усиливают ощущение постоянной опасности.
Перед нами не просто путеводитель, а своего рода игра, которая позволяет окунуться в атмосферу романов Кинга и посмотреть на мир его глазами.
Mixtral 8×22b
Этот гайд — как инструкция по технике безопасности: вроде всё по делу, но читать скучновато. Да, информация о Дерри присутствует, локации узнаваемые, даже Пеннивайз на месте.
Однако всему этому не хватает жизни. Сухой, формальный язык, отсутствие ярких деталей и юмора делают гайд похожим на статью в Википедии: информативно, но скучно.
Описания достопримечательностей не цепляют, советы звучат банально. Где та самая атмосфера ужаса и напряжения, которой так славится Кинг (или славился)?
Модели бы добавить в текст личности, ярких эпитетов и смелых метафор. И тогда путеводитель по Дерри превратится из сухого отчёта в увлекательное путешествие по миру Стивена Кинга.
Анализ ответов ИИ-моделей на различные запросы демонстрирует стремительный прогресс в области генерации текстового контента. Нейросети уже не просто составляют связные предложения, но и способны улавливать тонкости стиля, передавать эмоции, работать с вымышленными мирами и даже шутить.
Конечно, есть еще чему учиться у людей, однако следить за развитием нейросетей все же довольно интересно.
Спасибо за прочтение (: