Генерация текста нейросетями: обзор и сравнение моделей

Как далеко продвинулся искусственный интеллект в умении создавать тексты? От имитации стиля классиков литературы до написания путеводителей по вымышленным мирам — современные нейросети демонстрируют удивительные способности к генерации текстового контента самых разных форматов.

c2b42b99b4d2863883a04c69db010961.png

В этой статье мы рассмотрим работу различных ИИ-моделей на примере четырех нестандартных промтов, анализируя их сильные стороны, слабости и потенциал для дальнейшего развития.

Вам приятного прочтения, а мы не будем медлить и сразу перейдем к делу (:

Игра слов/стилизация

Промт:  Представь, что Чехов ведет свой твиттер-аккаунт. Напиши твиттер-тред (5–7 твитов), в котором Антон Павлович делится своими наблюдениями за случаем с хамелеоном на городском рынке, используя характерный для писателя юмор и лаконичность.

GPT-4o

GPT-4o достойно справилась с непростой задачей — имитировать стиль Чехова. Твиты получились лаконичными и точными, что соответствует как формату платформы, так и слогу писателя. Легкая ирония, внимание к деталям, философский подтекст за бытовыми зарисовками — все эти характерные черты Чехова присутствуют.

Однако без шероховатостей не обошлось. Местами проглядывает современный язык, который немного выбивается из общего стиля. Не хватает и виртуозного владения словом, игры смыслов, каламбуров, которыми славился Чехов. Можно было бы глубже обыграть тему «хамелеонства», связав её, например, с театром или литературой. Не хватает и характерных чеховских приемов — неожиданной концовки, ярких речевых характеристик персонажей.

В целом, GPT-4o демонстрирует понимание основных принципов стилизации, но пока не совсем то, поскольку чтобы достичь уровня Чехова, нужно не только знать его приемы, но и уметь так же тонко чувствовать язык и использовать его выразительные возможности.

GPT-4o mini

Этот ответ GPT-4o mini выглядит гораздо лучше. Текст читается легко, с юмором, за будничной зарисовкой скрывается глубокая мысль — все, как мы любим. Модель блестяще обыгрывает слово «хамелеон», превращая его в метафору человеческого приспособленчества. Да и каламбур про стыд хамелеона забавный.

Эмодзи и хэштеги, хоть и выглядят немного рискованно, в целом органично вписываются в формат блога и даже добавляют ему живости.

Конечно, идеала достичь сложно. Местами мысли высказаны слишком прямо, Чехов же предпочитал ненавязчивые намёки. Но в целом — хорошо. Модель продемонстрировала понимание творчества Чехова и смогла перенести его стиль в новый формат.

Claude-3.5 Sonnet

Этот ответ Sonnet, скорее, не стилизация под Чехова, а юмористическая сценка по мотивам его произведений. Получился забавный рассказ в духе анeкдота, с яркими образами и смешной концовкой.

Хештеги удачно обыгрывают ситуацию и добавляют комизма. Однако, если говорить о стилизации, то с Чеховым здесь мало общего. Нет ни его тонкой иронии, ни глубины, ни мастерской работы с языком. Это скорее современный юмор «по мотивам» классики.

В целом, это забавный тред, но назвать его удачной имитацией стиля Чехова нельзя. Для этого модели не хватает литературного чутья и глубокого понимания творчества писателя.

Claude-3 Opus

Этот тред на голову выше предыдущих ответов моделей в отношении стилизации. Создаётся впечатление, что сам Чехов взялся за телефон и решил поделиться с миром своими наблюдениями (утрирую, конечно). Язык безупречен: изысканный, ироничный, с лёгким налётом архаики.

За юмористической зарисовкой скрывается глубокий социальный подтекст, тонкая сатира на чинопочитание и конформизм — темы, которые волновали Чехова всегда. Образы живые и узнаваемые: важный надзиратель, робкий торговец — архетипы, не утратившие своей актуальности и в наши дни.

Финал — философский, открытый, заставляющий задуматься. Хештеги не только соответствуют формату, но и усиливают ироничный эффект.

Сложно найти какие-то недостатки — настолько органично и естественно выглядит этот текст. Opus не просто продемонстрировала понимание стиля Чехова, а почти что вернула его в наше время.

Gemini 1.5 Pro

Этот ответ — словно живая иллюстрация к чеховскому «Хамелеону». Узнаваемые персонажи, новая шинель, даже «нюх» Очумелова — Gemini удачно использует детали рассказа, чтобы создать комический эффект.

Хештеги добавляют юмора и вписывают классический сюжет в современный контекст. Однако, сосредоточившись на внешней оболочке рассказа, модель упустила из виду главное — его глубину. Финал предсказуем, нет неожиданного поворота мысли, который заставил бы читателя по-новому взглянуть на знакомую историю.

Получился забавный, но поверхностный пересказ «Хамелеона» в формате Twitter (X). Такой тред вряд ли припишешь самому Чехову, однако он может быть интересен в качестве шуточного дополнения к уроку литературы или поста в тематическом сообществе.

Gemma2 27B

6d63afdb3b5c12ca7e3758ed4ff643c7.png

Gemma уловила главное — чеховскую лаконичность и умение в малом разглядеть большое. История о хамелеоне превращается в метафору человеческого приспособленчества, и это вполне в духе Антона Павловича.

Однако до подлинного Чехова ещё далеко. Язык твитов, хотя и краткий, лишён чеховской изящности и тонкой иронии. Нет игры слов, неожиданных сопоставлений, парадоксальных мыслей — тех самых «изюминок», которые делают прозу Чехова неповторимой.

В итоге получилась скорее умелая имитация, чем творческое перевоплощение. Чтобы оживить этот тред, нужно добавить языку образности и глубины.

Mixtral 8×22b

А вот Mixtral огорчил. Хотя и интересные образы встречаются, и темы поднимаются важные, но общий тон повествования далек от авторского. Излишняя сентиментальность («нежно погладила», «будем счастливы»), прямолинейные нравоучения в финале — все это совершенно не в духе Чехова.

Реплики героев звучат искусственно, им не хватает живости и естественности. Ирония, юмор, тонкая игра смыслов — все то, что делает прозу Чехова неповторимой, здесь отсутствует.

Вместо чеховского взгляда на мир — с его смесью грусти и юмора, проницательности и снисходительности — мы видим скорее сентиментальную притчу.

Эмоции и субъективность

Промт:  Ты — фуд-блогер, снявший реакцию на первую дегустацию дуриана. Опиши свои ощущения, сначала передав отвращение от запаха и вида фрукта, а затем — неожиданный восторг от его вкуса. Добавь яркие сравнения и метафоры.

GPT-4o

c09422dd06a21bd7dadd85e65d0ed88b.png

GPT-4o отлично передала перепады ощущений от дегустации дуриана — от отвращения до абсолютного восторга. Яркие метафоры и сравнения («уверенность начала таять, как мороженое», «вкусовые рецепторы начали танцевать») создают эффект присутствия, мы словно сами чувствуем этот необычный вкус.

Модель не жалеет красок, описывая и внешний вид, и запах, и, конечно, вкус дуриана. Мы проходим этот путь вместе с ним — от первоначального шока до финальной эйфории.

Но чего-то не хватает, а именно индивидуальности. Пара фраз о собственных эмоциях, мимике, мыслях во время дегустации — и текст заиграет новыми красками. Стоит избегать и шаблонных фраз вроде «магия вкуса» — они лишь затемняют впечатление от действительно яркого и оригинального описания.

GPT-4o mini

be79cdb646c76d166f51dbcadba7a858.png

Этот текст — уже не просто описание вкуса, а таки ода дуриану. Текст богат образами и метафорами, 4-о mini виртуозно передаёт палитру эмоций.

Сравнение дуриана с реквизитом из фильма ужасов сразу цепляет, а фраза про «старую обувь» невольно заставит читателя зажать нос. Переход от отвращения к восхищению описан настолько плавно и естественно, что мы словно сами проживаем этот опыт вместе с автором.

«Поцелуй солнца», «сладкая нежность», сравнение с любовью — эти образы делают текст глубоким и многогранным. Хотя, возможно, некоторые метафоры могут показаться излишне вычурными (ну, это уже на любителя).

В целом же — это хороший текст, который демонстрирует не просто богатство языка, но и умение нейросети передавать нюансы вкуса и чувства.

Claude-3.5 Sonnet

d5f710db60c3cabac0f2e180d5ef2bcb.png

Нейросеть постаралась на славу, чтобы передать эмоции от дегустации дуриана: тут вам и «гнилые носки», и «тухлые яйца», и даже шуточки про завещание.

Однако за этим эпатажем теряется достоверность. Фуд-блогер получился слишком уж карикатурным: то он в обморок падает от запаха, то сравнивает вкус с «заварным кремом с карамелизированным луком» (не самое аппетитное сочетание как мне кажется).

Не хватает и конкретики в описании вкусовых нюансов. Вместо этого — набор избитых фраз про «симфонию вкусов» и «гастрономическую Страну чудес».

В итоге получилась скорее шуточная зарисовка, чем убедительный пост фуд-блогера. Не сказать, что Sonnet умеет в передачу вкусовых ощущений.

Claude-3 Opus

a3b0d21e7fbe49d56e17c909b3d311bc.png

Opus смогла создать по-настоящему «вкусный» текст. Чувствуется атмосфера фуд-блога, модель имитирует эмоции (чего стоит одно «запах ударил в нос так, что глаза заслезились»), но в то же время остается «профессионалом».

Описание вкуса — выше всяких похвал: «сливочная текстура», «ванильная нотка», «оттенок ореховой пасты» — кажется, ещё немного, и мы сами почувствуем этот необычный вкус.

Финал, хоть и использует популярные клише про «разрыв шаблона», в целом звучит органично.

Чего не хватает? Опять же личных впечатлений автора. Пара фраз о мыслях и чувствах во время дегустации — и текст заиграет новыми красками.

В целом же — это отличный образец текста для фуд-блога: живой, образный, аппетитный.

Gemini 1.5 Pro

6c182a85c4ed27bf91b4f88e7277921e.png

Теперь текст от Gemini, что видим? Здесь и юмор, и яркие образы, и легкость изложения. Нейросеть — словно ваш хороший друг, который с искрометным юмором рассказывает о своём необычном гастрономическом опыте.

Сравнение с «американскими горками» сразу интригует: кажется, поездка предстоит незабываемая. И действительно, дальше — целый калейдоскоп образов: «мусор после апокалипсиса», «концерт для потных носков» — забавно и в то же время очень точно.

Модель имитирует открытость «автора»: он не боится быть честным, признаётся в своём страхе и отвращении, что делает его ещё ближе к читателю. Ну, и финальное сравнение с прыжком с парашютом хорошо звучит.

Хотелось бы, пожалуй, немного подробнее узнать о самом вкусе дуриана, но в целом — это отличный текст.

Gemma2 27B

a45dd9f40d5ce7ae94c40135073a34c5.png

Gemma, как истинный фуд-блогер, проводит нас по всем кругам дегустации дуриана: от отвращения и шока до внезапного, всепоглощающего восторaга. Мы словно сами ощущаем на себе этот «взрыв тропического рая», несмотря на «бомбу из тухлых яиц», витающую в воздухе.

Яркие образы и метафоры — главный козырь текста. Они действуют не хуже спецэффектов, погружая нас в атмосферу необычной дегустации. Контраст между запахом и вкусом обыгран мастерски, держа в напряжении до самого финала.

Чего же не хватает? Опять же капельки личности. Кто этот смельчак, отважившийся на эксперимент с дурианом? Пара штрихов к портрету — и перед нами будет не просто автор, а яркая личность, чьим вкусовым рецепторам хочется довериться.

В целом — тоже хороший текст.

Mixtral 8×22b

4f6861cdb3cf8466f32c5ff4197c0588.png

В этом ответе Mixtral не удалось поразить нас историей о дегустации дуриана. Кажется, модель очень старалась сделать текст ярким и эмоциональным, но в итоге получилось чрезмерно и неубедительно.

Фразы вроде «чуть не упал в обморок» или «запах, который нужно запретить» звучат нарочито и неестественно. Шаблонные сравнения с «вонючей обувью» и «гнилыми яйцами» только усугубляют ситуацию.

В общем, текст выглядит очень машинным и легко читается имитация эмоций. Обилие слов вроде «необычайно» и «невероятно» делает язык тяжеловесным и скучным.

В итоге получился довольно шаблонный и не очень интересный текст.

Нестандартные (?) форматы

Промт:  Ты — автор путеводителя по мирам Стивена Кинга. Напиши краткий гайд для туристов, решивших посетить город Дерри. Опиши 3–4 главные достопримечательности (с учетом их опасности и необычности), а также дай пару советов тем, кто хочет остаться в живых.

GPT-4o

5f8178bd6ec19adf2626e2329e36a3af.jpg

Модель создала вполне убедительный путеводитель по зловещему городку Дерри — с учётом всех его особенностей, описанных в романах Стивена Кинга. Здесь вам и знаковые локации (канализация, башня), и неизменный Пеннивайз, и атмосфера постоянной опасности.

Описание достопримечательностей интригует и одновременно предупреждает: кажется, что за поворотом может ждать что угодно. Советы по выживанию тоже в тему: фанатам, вероятно, понравится.

Конечно, не обошлось без небольших штампов (куда же без «мрачной атмосферы» и «обширной сети туннелей»). Немного не хватает конкретики: можно было бы вплести в текст пару-тройку отсылок к событиям из книг или добавить реплики вымышленных очевидцев.

Но в целом — это хороший гайд, который может понравится поклонникам творчества Кинга. Модель продемонстрировала отличное знание материала и умение работать с нестандартными запросами.

GPT-4o mini

0952387031510e85fbc84d465d220dbd.jpg

Мини же постаралась создать путеводитель по Дерри, и у неё получилось неплохо, но… без особого блеска. Да, здесь есть атмосфера тайны и ужаса, советы туристам звучат вполне разумно, но в целом не хватает изюминки.

В отличие от предыдущего варианта, здесь нет отсылок к конкретным местам из книг Кинга. «Канал», «амбар», «кладбище» — слишком уж общие локации, которые вряд ли вызовут у фанатов какие-либо ассоциаций. Да и сам текст переполнен клише вроде «мрачная репутация» или «странные звуки».

В итоге получился довольно шаблонный путеводитель по «городу с тайнами». Хорошо, но хотелось большего. Немного конкретики, пару ярких деталей, отсылка к любимым страшилкам — и гайд заиграл бы новыми красками.

Claude-3.5 Sonnet

b103b586a474a327d9f46534f8752e13.png

А на очереди Sonnet, которая создала лаконичный и информативный путеводитель по Дерри, но он, к сожалению, оставляет впечатление недосказанности. Да, знаковые локации упомянуты (канализация, мост поцелуев, библиотека), советы по выживанию даны, юмор тоже на месте.

Однако всему этому не хватает глубины и атмосферности. Описания достопримечательностей слишком скупые, им не хватает тех самых леденящих душу подробностей, которыми так славится Кинг. Пеннивайз и красные шарики упомянуты лишь вскользь, не вызывая настоящего страха и трепета.

В итоге получился гайд, который просто информирует и не пугает.

Claude-3.5 Opus

842ec370c4aa0b68e78d68836b57fdf4.png

Этот гайд — как предчувствие хорошего фильма ужасов: интригует, но пока не пугает. Атмосфера Дерри передана верно, описания мест цепляют, а конкретные локации (водонапорная башня, дом на Нейболт-стрит) добавляют реалистичности.

Советы по выживанию тоже стали более конкретными и «кинговскими». Однако модели не хватает смелости зайти дальше общих фраз. Пеннивайз, оборотень — все это звучит слишком обобщённо. Где же те самые леденящие душу подробности, отсылки к сюжету, которые заставили бы фанатов вздрогнуть?

В итоге получилось просто хорошо. Немного больше смелости, оригинальности, «кинговской» жути — и гайд превратится в настоящий подарок для поклонников мастера ужасов.

Gemini 1.5 Pro

ed00286f92b3897f8da30b6149652678.png

А вот ответ Gemini уже лучше. Здесь хорошо все: и атмосфера Дерри с его двойственностью (уютный городок с жуткими тайнами), и фирменный юмор на грани с ужасом, и знаковые локации, которые мгновенно вызывают нужные ассоциации.

«Не смотрите в глаза клоунам», «книги с подозрительными обложками» — эти детали делают гайд пугающе достоверным. А финальное «Наверное…» оставляет послевкусие недосказанности.

Да, пару отсылок к конкретным событиям из книг не помешали бы, но и без них — это хороший текст. Модель продемонстрировала глубокое понимание творчества Кинга и создала гайд, который мог бы стать частью энциклопедии по его миру.

Gemma2 27B

6df9b2772eab005b615d9018b9df4f6d.png

Нейросеть приглашает нас в пугающе притягательное путешествие по Дерри. Описание достопримечательностей балансирует на грани между черным юмором и настоящим страхом. С одной стороны, нам предлагают попробовать местные пирожные, с другой — советуют обходигать стороной клоунов.

Советы по выживанию, хоть и звучат местами банально, лишь усиливают ощущение постоянной опасности.

Перед нами не просто путеводитель, а своего рода игра, которая позволяет окунуться в атмосферу романов Кинга и посмотреть на мир его глазами.

Mixtral 8×22b

cb168c03d01de260451ecff82c30e260.png

Этот гайд — как инструкция по технике безопасности: вроде всё по делу, но читать скучновато. Да, информация о Дерри присутствует, локации узнаваемые, даже Пеннивайз на месте.

Однако всему этому не хватает жизни. Сухой, формальный язык, отсутствие ярких деталей и юмора делают гайд похожим на статью в Википедии: информативно, но скучно.

Описания достопримечательностей не цепляют, советы звучат банально. Где та самая атмосфера ужаса и напряжения, которой так славится Кинг (или славился)?

Модели бы добавить в текст личности, ярких эпитетов и смелых метафор. И тогда путеводитель по Дерри превратится из сухого отчёта в увлекательное путешествие по миру Стивена Кинга.

Анализ ответов ИИ-моделей на различные запросы демонстрирует стремительный прогресс в области генерации текстового контента. Нейросети уже не просто составляют связные предложения, но и способны улавливать тонкости стиля, передавать эмоции, работать с вымышленными мирами и даже шутить.

Конечно, есть еще чему учиться у людей, однако следить за развитием нейросетей все же довольно интересно.

Спасибо за прочтение (:

© Habrahabr.ru