[Перевод] Убивают ли LLM сайт StackOverflow?

После выпуска ChatGPT в ноябре 2022 года количество задаваемых на StackOverflow вопросов стало быстро снижаться, и в 2025 году падение продолжается с угрожающей скоростью. Свежие данные, представленные разработчиком ПО Теодором Смитом из 1% лучших контрибьюторов StackOverflow, показывают, насколько плоха ситуация. Он поделился количеством задаваемых пользователями вопросов в дампе Gist:

Количество задаваемых ежемесячно вопросов на StackOverflow

Количество задаваемых ежемесячно вопросов на StackOverflow

Столь малого количества вопросов на StackOverflow не было с 2009 года! График демонстрирует резкое снижение уровня вопросов, ускоренное запуском чат-бота OpenAI, и причины этого понятны: LLM — самый быстрый и эффективный помощник разработчиков, испытывающих проблемы с кодом.

До появления этой технологии оптимальнее было воспользоваться StackOverflow, чем гуглить в попытках найти пост с ответом. А если пользователь не мог найти ответа, то он мог опубликовать вопрос на StackOverflow и кто-то, возможно, ответил бы на него.

На самом деле, упадок StackOverflow начался до появления ChatGPT, хоть, конечно, его и проще винить в падении количества вопросов:

В апреле 2020 года, спустя месяц после начала пандемии Covid-19, на StackOverflow возник кратковременный всплеск активности. Однако примерно с июня 2020 года сайт испытывал медленное, но стабильное снижение количества вопросов. ChatGPT лишь ускорил этот упадок.

С 2018 года StackOverflow всё больше критиковали за его политики модерации. С одной стороны, StackOverflow использовал труд модераторов для объединения дублирующихся вопросов, закрытия постов не по теме и поддержания корректного общения. Но модерация стала казаться недружественной к новичкам, им с трудом удавалось публиковать вопросы, которые сразу же не закрывались бы модератором. Задавать вопросы, которые оставались открытыми, само по себе превратилось в трудную задачу; и это было сделано намеренно. Но достаточно легко понять, почему повышение сложности задавания вопросов приводило к снижению количества публикуемых вопросов.

Казалось, StackOverflow перестал вводить инновации, и это могло привести к первоначальному падению количества вопросов. Патрик Берроуз написал в комментариях к исходной статье:

«Stack Overflow так и не добавил возможность видеоответов (не знаю, пытались ли вообще разработчики это сделать), что, вероятно, внесло свой вклад в то, что его популярность начала снижаться. Можете относиться к этому, как угодно, но молодёжи (в том числе и молодым программистам) удобнее смотреть видео, чем читать текст. На сайте и сегодня нет удобного способа задать вопрос или ответить на него в видео.

Руководство и менеджеры Stack Overflow должны были заметить этот тренд и обеспечить актуальность своего ресурса. При желании они могут называть LLM убийцей своего бизнеса (и я уверен, что такое желание будет), но они не пытались оставаться релевантными, модернизировать и улучшать свой продукт.

(Лично я не люблю смотреть видео, чтобы найти ответы на свои вопросы…, но то я, старик.)»

И дело не только в видео. Примерно в 2020 году разработчики начали вступать в группы о программировании в Discord или Telegram: там задавать вопросы было гораздо проще, чем на StackOverflow. Аналогично тому, как StackOverflow не смог отреагировать на рост популярности видеовопросов и ответов, сайт никак не отреагировал на сервисы наподобие Discord. Будем откровенны: продукт перестал внедрять инновации.

Упадок был достаточно заметен год назад, когда я проверял в последний раз. Год назад я спросил, не преувеличена ли информация о стагнации StackOverflow. В то время данные выглядели мрачно:

Статистика, представленная членами сообщества StackOverflow с репутацией от 25 тысяч. Источник данных: The Fall of Stack Overflow

Статистика, представленная членами сообщества StackOverflow с репутацией от 25 тысяч. Источник данных: The Fall of Stack Overflow

Тогда компания назвала одним из виновников упадка трафик поисковых движков. Однако прошёл уже год, и можно с уверенностью сказать, что StackOverflow нужно чудо, чтобы разработчики начали задавать вопросы в тех же объёмах, что и раньше.

Снижение количества вопросов показывает, что настоящие проблемы впереди. Основной трафик StackOveflow приходит из поисковых движков, поэтому этот упадок вряд ли приведёт к мгновенному резкому падению посещений. Однако любое снижение может превратиться в порочный круг: чем меньше вопросов задают, тем больше устаревает контент сайта и тем меньше на нём актуальных ответов. В свою очередь, сайт получает меньше трафика из поисковых движков, а посетители, пришедшие на сайт через поиск, обнаруживают, что ответы ужасно старые.

Упадок StackOverflow пример того, насколько катастрофичным может быть влияние генеративного ИИ на прежде стабильные бизнесы. В 2021 году StackOverflow приобрёл за 1,8 миллиарда долларов инвестиционный фонд Prosus, и даже с учётом умеренного падения трафика сайт оставался одним из самых привлекательных онлайн-ресурсов для разработчиков ПО, а значит, и ценным активом. Однако новые данные говорят о необратимом упадке, и сложно придумать способы сохранения релевантности StackOverflow в будущем.

StackOverflow по-прежнему продаёт продукт Teams для внутреннего Q&A. Однако падение публичного трафика StackOverflow предполагает, что бывшие пользователи предпочитают использовать для ответов на вопросы внутренние LLM компаний, а не сайты наподобие StackOverflow.

Инвестиционные фонды часто имеют репутацию приобретающих компании по минимально возможной цене с последующим выжиманием из них денег. В случае StackOverflow ситуация может быть обратной: фонд рискнул, приобретя крупный ресурс, что привело к существенным потерям.

Ещё один вопрос: откуда LLM будут получать в будущем данные для обучения вопросам и ответам?  В каком-то смысле мне кажется, что StackOverflow — жертва LLM, которые потребляют его данные для использования на своих сайтах и предоставляют гораздо более удобный интерфейс для решения задач программирования. Но теперь, когда на сайте становится меньше вопросов и ответов, откуда будут браться данные обучения?

На этот вопрос нет чёткого ответа, как и на вопрос о том, откуда будет браться следующее поколение начинающих разработчиков ПО, ведь большинство компаний снизило объёмы найма из-за того, что LLM могут выполнять примерно ту же работу, что и выпускник вуза.

Думаю, отрасль адаптируется: возможно, LLM в будущем не так хорошо будет справляться в ответе на вопросы в стиле StackOverflow, но у неё появятся более расширенные возможности, способные это компенсировать; например, они будут пробовать разные решения и проверять их, или, возможно, более полезными станут агенты-помощники в кодинге.

То же относится и к вопросу о разработчиках-новичках: технологическая отрасль всегда адаптировалась, и я не вижу, чем современная ситуация может в этом отличаться.

© Habrahabr.ru