Как я сделал сервис генерации рефератов (погодите кидаться тапками)
Мы сделали сервис для генерации рефератов и научных статей, которые не детектируются антиплагиатом.
Потому что заметили, что за это платят. И потому что могли.
Похожие сервисы используют всеми любимые сеошники, а поисковые машины с этим борются. И такая потребность есть у студентов, которым надо быстро сдать реферат. В Болонской системе до 80% домашних заданий могут быть в форме эссе. И это не только гуманитарная фишка, даже какому-нибудь инженеру могут дать задание написать о, например, состоянии солнечной энергетики в Техасе.
Потом преподаватель прогоняет реферат через один из инструментов антиплагиата и говорит: «Смотри, это даёт оценку 95% AI generated. У тебя оценка ноль. Если у тебя будет вторая оценка ноль, то мы тебя отчислим».
А мы научились правильно вносить шум в тексты, чтобы они не детектировались таким образом. Потому что поняли, что генерация эссе — это потенциально огромный рынок, с LLM эта история не зависит от языка, студенты платят со всего мира.
С одной стороны, были некоторые сомнения, с другой — большинство наших пользователей используют генерацию как отправную точку для дальнейшей работы над текстом. Ну и миллион долларов в месяц тоже, конечно же, повлиял. В общем, Маша, это, конечно, Маша, но миллион — это миллион.
Основной аудиторией сервиса изначально предполагались студенты бакалавриата. Но потом выяснилось, что у нас в клиентах много докторов наук. Да, им тоже важно не продолбать дедлайны, сохранив при этом качество текста. И с нашей помощью они могут создать эссе не за 12, а за 4 часа.
Сегодня 80% нашей аудитории — это люди 25+. Это те, кто учится на MBA или PhD, получает второе высшее, проходит переподготовку, или это бакалавры, которые учатся на магистров. Это такая категория людей, которая экономит время. Они работают, и у них мало времени, но есть деньги. Они учатся, чтобы повысить свою ценность на рынке труда. Они готовы платить за сервис, который поможет им сэкономить время на рутинный подбор литературы, решение проблемы «чистого листа», поиск источников, агрегацию текстов и так далее.
Сервис не даёт конечный результат. Работы, которые делают с нашей помощью, — это не то, что за пять минут сгенерировали и отдали как есть. Нет! Сервис помогает создать скелет работы, даёт первичную информацию, наводит на какие-то нужные мысли. Дальше они с полученным первичным результатом работают — уточняют, усиливают, улучшают. И только потом уже несут эту работу сдавать. При этом качество их работ, и, если взять шире, их учёбы — не падает.
С чего всё это вообще началось
SKL постоянно мониторит рынок на предмет выстреливших стартапов и рассматривает вариант либо их купить, если там есть что-то ценное, либо сделать самим, если есть внутренние ресурсы. Так мы заметили стартап, который «выстрелил», — сервис, с помощью нейросетей генерирующий эссе для студентов, вышел на 300 тысяч долларов выручки в месяц.
Так вот, это был хороший показатель, но сам сервис был так себе — ни дизайна нормального, ни функционала, банально неудобно было им пользоваться. Как у продукта его шансы были невелики, там нечего было покупать, это был случайный взлёт с завирусившегося видео. Но идея была интересной.
Собственно, мы поняли, как сделать что-то похожее, но другое. Это можно назвать заимствованием идеи, но идеи не защищаются. Более того, если вы сделаете любой сервис, который будет показывать успех, отличный от нуля на американском рынке или ЕС, то его очень быстро обнаружат и начнут копировать. А если с оценкой 100М и выше, то количество клонов будет исчисляться десятками ежемесячно.
Но вернёмся в апрель 2023.
У меня как раз закончился старый проект, мозги были свободны. Поэтому я предложил самим создать такой продукт. Почему бы и нет — решили в SKL. Вообще я CTO. Раньше занимался крупными коммерческими проектами, которые выходили на IPO. В SKL пришёл как CTO и техлид, а также сам участвовал в разработке и писал код.
За полдня собрал рабочий прототип, потом подключил фронтендера. И так через две недели мы запустили первую версию платформы Aithor, а месяцем позже уже была первая продажа.
Упор сделали на две вещи: простой интерфейс и антибюрократичность. Никаких сложных меню: пользователь на каждом этапе должен сделать всего один выбор.
И никаких лишних сотрудников типа менеджеров, аналитиков и даже тестеров. Да, я уверен, что в таких проектах, как наш, все эти люди лишние и не только не помогают, но и мешают процессу.
Так выглядит начало работы с Aithor: выбор темы
Как стартовали
К 24 апреля 2023 мы буквально за две недели вдвоём с ещё одним разработчиком закодили проект. 25 мая у нас была первая продажа. Где-то в июне 2023 года мы поняли, что в целом можно свести экономику. Пришёл СМО, с ним мы через два-три месяца это дело раскачали, и в октябре-ноябре 2023 стало понятно, что эта вся штука полетела. В ноябре мы уже заработали, была выручка сотни тысяч долларов за месяц. Дальше был низкий сезон, когда студенты ничего не сдают. Высокий сезон — это октябрь-ноябрь и март-апрель. В следующий высокий сезон в марте выручка была примерно миллион. В апреле опять венчурный рост.
За первые несколько месяцев ушло как минимум около 300 тысяч до начала операционной окупаемости. Основные затраты были в маркетинге, чтобы лить трафик и, соответственно, конвертить людей.
Наш основной по сей день источник трафика — инфлюенс-маркетинг. Мы стали на потоке выпускать видео в TikTok, покупать у микроинфлюенсеров. У нас средняя стоимость видео около 200 долларов. Сейчас мы выпускаем порядка 200 видео в месяц, соответственно, суммарно нам это даёт около 20 миллионов просмотров в месяц.
Как работает
Выбираете, что написать, в каком стиле, какого размера, генерите план, получаете текст, в тексте можно кликать разные абзацы и применять к ним фильтры. Всё. Next-next-custom-done. И текст не определяется инструментами AI-детектора.
База — это API ChatGPT (начинали c 3, сейчас 4o/4o mini) от OpenAI и Azure. Дальше — сложный промптинг, файнтюнинг и прочее колдунство.
Обычно текст, который генерирует нейросеть, можно определить специальными программами, вузы активно их используют. А если ваше эссе было сгенерировано нейросетью, за него ставят ноль баллов — на первый раз. Потом и отчислить могут.
Создание ТЗ на эссе состоит из нескольких шагов. Можно, например, задать работы, на которые стоит сослаться
Здесь и вступает в дело наша киллер-фича. С помощью хитрого промптинга, файнтюнинга и особой логики общения можно генерить тексты, которые не детектятся. Для генерации хорошего эссе нужно учитывать много параметров, от тона текста до того, какого типа работы брать в качестве источников. Однако мы сделали так, что на каждом этапе человек принимает только одно решение.
Максимально просто.
Большое количество параметров важно ещё вот почему: я считаю, что история, при которой ИИ сам всё за вас делает, плохая. Представьте, если такие эссе, например, врачи сдавать будут.
Поэтому мы используем ИИ как помощника, выполняющего технические, рутинные задачи. Человек должен креативить, ставить задачи, а нейросеть помогает переводить это в текст. У нас есть разные фичи для того, чтобы потом с этим текстом работать. Допиливать его под свои потребности: какую-то часть сократить, куда-то добавить новый контекст. Платформа развивается, мы стремимся на каждом этапе работы над текстом добавлять больше опций.
Борьба за эффективность
Изначально мы обходились сложным промптингом. Это работало ещё год назад. Но со временем тулы по детекту становятся всё умнее. Они всё лучше детектят, мы всё лучше скрываемся. Сейчас это специальные файнтюненные модели. Мы дотренировываем их на специально отобранных текстах, которые сами по себе выглядят очень человеческими.
Хочется верить, что в перспективе мы в этом вопросе будем с руководством вузов на одной стороне.
Что они поймут: нейросети, помогающие генерировать текст, это уже неизбежная часть нашего настоящего и будущего. Они позволяют понимающему человеку, который уже проделал достаточно большой объём работы, просто сэкономить время. Вместо 12 часов на написание эссе потратить 3 или 4. В Aithor уже есть RAG, да и в целом он заточен в первую очередь под оптимизацию процесса исследования, а во вторую — под генерацию сложного текста. Короче, не просто «нажал кнопку — оно сгенерировалось», а вычитал, подкорректировал, отправил на доработку, повторил.
После генерации эссе можно править прямо на платформе, работая с отдельными частями текста
Проблемы были, конечно. В какой-то момент нас чуть не убил Stripe. Это провайдер, через которого мы принимали платежи. В феврале он заблокировал половину всех поступлений. Потому что, по его мнению, у нас высокорисковый бизнес и большой процент чарджбэка. Большой — это, для справки, 0,8%. И ради них заблокировали 50% всех средств, это как-то ну совсем несопоставимо.
Мы боролись, закидывали их обращениями, но на всё получали ответ в духе «Это окончательное решение, ничего объяснять или менять не будем». Так, на этапе, когда нужно было развивать сервис и тратиться на маркетинг, в критически важный момент мы лишились половины выручки, и это было критично. Спасло то, что студия помогла закрыть кассовый разрыв.
Все деньги потом разморозили, но осадочек, как говорится, остался. Сейчас ищем другого платёжного провайдера.
Сейчас в команде 20 человек. Причём только разрабы, тестеры на такого рода проектах, я считаю, не нужны. Потому что процесс тормозится: разработчик сегодня написал код, тестер его проверил — скорее всего, на следующий день. Нашёл какие-то баги, кинул обратно, на это ещё время ушло. И получается, что разрабу нужно вернуться к коду, который он писал едва ли не позавчера. А у него уже другой контекст в голове, другие задачи.
Изначально, когда мы сделали 180 тысяч долларов, у нас 80% аудитории была UA и UK, примерно по 40%. Весь остальной мир был 20%. Сейчас US, наверное, 12%. Самые большие страны — Бразилия и Мексика. Всего около 180 стран, например, был трафик даже из Антарктиды. Продвигаемся тоже везде. Соответственно, трафик льём и перформансом, то есть Гугл и соцсети из разных стран на разных языках. Инфлюенсерские видео выпускаем на разных языках: арабском, испанском и вообще любом. Антарктидный не знаем только.
Средний чек у нас сейчас около 45 долларов. Подписка в месяц стоит 25, три месяца стоит 50 и год стоит 100. Сейчас мы планируем повышать цену ещё.
Стараемся брать лучшие практики, то есть CI/CD автоматизации тестирования. У нас, например, нет тестировщиков. У нас есть только разработчики. Всё тестирование автоматизируем. Trunk Based Development, постоянно коммитим main каждый день в Trunk. У нас очень часто интегрируется код, и это то, что рекомендуют всякие мастодонты типа Роберта Мартина какого-нибудь, Мартина Фаулера, Кента Бека. Мы очень часто интегрируем код. Пишем код по TDD. Это очень сложная в освоении, но крутая практика. Стараемся давать разработчикам максимум контекста и понимания, какую проблему они решают, максимум свободы в плане того, чтобы предложить наилучшее решение и, соответственно, поставить максимум ценности клиенту. Не скажу, что у нас много Rocket Science, да, файнтюним модели, но там мы не пытаемся делать свои LLM. Это всё важно, потому что я работал в кровавых энтерпрайзах, в банках, в МТС. Я видел, насколько медленной и неэффективной может быть разработка. Команда из 40 человек делала то, что мы с той же эффективностью делали до этого впятером. И говорят, что это лучшая команда. Что-то с ними не так, они не следуют правилам, срезают углы.
Такая же история с бизнес-аналитиками. Я считаю, что это важная функция, но отдельный такой человек в команде просто тормозит процесс. Он не вовлечён, он что-то анализирует, пишет требования, но к тому моменту, когда они дойдут до разработчика, они уже устареют. В сложных продуктах это важно, для нас — излишне.
С таким подходом у нас минимальное расстояние от бизнес-проблемы до новой фичи на платформе, мы быстро поставляем ценность. Релизы каждый день, и я уверен, что даже если нас будет сто человек, скорость не упадёт.
Такая схема работы, кстати, нам здорово помогла, когда одна сторонняя организация сюрприз подкинула. Authorization-провайдер, через которого работала форма для входа, неожиданно поменял условия и предложил заплатить сразу за три года, полмиллиона долларов. Мол, или платите — или мы вас сейчас отключим. На нормальный переход к другому провайдеру обычно месяц нужен, но мы собрались и за четыре дня всё сделали. Пришлось по 14–16 часов в день поработать, но успели.
Цель
Мы начинали с технической задачи «ух ты, а можно ли сломать антиплагиат», а пришли к чему-то вроде нового текстового процессора. По большей части верхний сегмент аудитории приходит с готовыми мыслями, но нуждается в формулировках. Где-то речь про суммаризацию научной работы, где-то поиск источников, где-то просто закидывают тезисы и просят модель фактчекнуть и расписать их. В итоге получился именно инструмент.
Да, в университетах всего мира идёт война старого и нового. Да, это касается как форматов преподавания (от лекций к проектной работе, лекции — удел единиц, великих учёных и практиков, сочетающих талант исследователя и актера, Кастельса, например, совершенно невозможно было слушать — старый зануда! Или гениального Макквейла, зато какие тексты! А что они могли бы создать с таким помощником, как Aithor?!), так и форматов контроля, отчётности и технологий, допустимых в работе. Такая борьба всегда была, есть и будет. Это борьба старого и нового.
Это и есть то, что называется прогресс.
Такие технологии в перспективе помогут тем же врачам-практикам писать научные работы. Надо закинуть все исходники и мысли, посмотреть, что получилось (получится ужасно), и отредактировать, а не писать с нуля. Сегодня при реальной нагрузке врача, у него просто нет времени на оформление публикаций по ГОСТу (это если в России) или в соответствии с западными стандартами оформления научных публикаций. При этом на местах часто появляется ценная фактура.
Aithor будет развиваться в сторону инструмента, который полезен на всех этапах исследования. Вводите тему, система предлагает релевантные научные статьи, которые можно выбрать, а можно загрузить свои, дальше коллаборация интеллектов и брейнсторминг с бездушной машиной, потом генерируете структуру и работаете — хоть индивидуально, хоть в команде. При этом загруженные материалы формируют большую базу знаний, как у Scribd. Платформа будет работать с любыми языками, что позволит создавать и использовать работы на языках, с которыми вы не знакомы. Мы также планируем создание мультимодальных выходов, таких как таблицы, графики, презентации, изображения и, возможно, видео.
Дальше мы хотим прийти к набору ассистирующих инструментов, чтобы люди могли делать интеллектуальную работу быстрее, а не обманывать преподавателя. Стать платформой по умолчанию для исследований. И, кажется, через вот такой странный проект это получится.
Ну или нет.
Потому что интернет создаётся профессорами, а используется студентами.