Небольшая ретроспектива по статистике статей Хабра

94408552b58e9185cdf14479d83860ed.png

Хабр недавно написал статью про итоги ушедшего 2022 года. В комментариях у меня и нескольких пользователей возник вопрос, что мол статистика как-то странно подана, мол люди перемешаны с конями, почему так? Мне стало интересно.

По идее, чтобы дать нормальную статистику, достаточно просто спарсить Хабр, и скорее всего задача не из самых сложных, но мне не очень хотелось этим заниматься в последних числах декабря. Я пошел другим путем — вооружился поиском, и постарался найти все статьи с похожим содержанием за последние лет 5. Пальма первенства по «итогам года» только недавно перешла к редакции, раньше «итоги» публиковали в том числе обычные пользователи.

Меня интересуют следующие гипотезы, которые зачастую блуждают у меня в голове и секции комментариев:

Методология

Просто беру цифры as-is из указанных ниже источников. Задачи делать большое исследование не стоит. Да, я понимаю, что если в 2020 году кто-то насчитал N статей, в 2022 году с годом публикации 2020 будет явно меньше, чем N статей. Я мог проверить «внахлест» буквально пару точек по смежным годам, отличие было не очень большим. Эффект от слияния / разделения Хабра и Geektimes я никак не учитывал. Если где-то напутал что-то — прошу написать в комментариях, или дополнить ряды.

Что получилось

Если не растекаться, получилась пара графиков:

Материалы по типамМатериалы по типамd7c31f6d38673225da8abbb9ca985e4f.png

И парочка таблиц, по количеству материалов:

2016

2017

2019

2020

2021

2022

Авторы

       5 294

       9 151

    10 283

       9 353

Корп. Блоги

       5 666

       9 066

    10 850

       9 501

Новости

       3 783

       6 540

    11 160

Всего

    12 255

    10 960

    19 000

    22 000

    27 673

    30 014

И по количеству комментариев:

2021

2022

Комменты

 667 356

 562 210

Вместо выводов

Упражняться в расчетах темпах роста или прироста лишний раз не буду. Делайте выводы сами. Отмечу только, что по-хорошему надо бы таки спарсить Хабр и построить нормальную статистику за все годы.

Источники:

Большое количество статей@DmitrySpb79(прекрасный автор, увы, ушел с Хабра)
https://habr.com/ru/company/habr/blog/705476/
https://habr.com/ru/company/habr/blog/597043/
https://habr.com/ru/post/480034/
https://habr.com/ru/post/479466/
https://habr.com/ru/post/534022/
https://habr.com/ru/company/cloud4y/blog/345508/
https://habr.com/ru/company/habr/blog/345916/

© Habrahabr.ru