Хабрастатистика: небольшой анализ популярности хабов
Привет Хабр.
При подготовке материалов к рейтингу статей и авторов этого года (если кто не читал, ссылка здесь и здесь), я нашел довольно интересную закономерность, которую вроде бы статистически еще никто не рассматривал. Речь пойдет о популярности разных разделов (хабов) здесь на Хабре.
Статья будет интересна скорее «писателям», еще не определившимся, в какой хаб писать новый шедевр, «читатели» могут решать сами, читать или нет.
Подробности под катом.
Как всегда, традиционный disclaimer: все подсчеты и рейтинги являются неофициальными, и я не исключаю что нигде не ошибся.
А теперь, приступим. Сегодня мы рассмотрим подробнее разные хабры Хаба, т.е. наоборот, хабы Хабра :) В качестве «разминки» посмотрим топ хабов по числу просмотров:
Тут ничего неожиданного, и картинка более-менее соответствует «официальному» рейтингу на https://habr.com/ru/hubs/. Однако число просмотров в чистом виде сложно сравнивать, т.к. оно зависит от количества статей, которое для всех хабов различно. Гораздо более интересные результаты получаются если вывести топ хабов по среднему числу просмотров за статью:
Тут все становится куда более забавно. С заметным отрывом побеждает хаб… brainfuck, в котором впрочем, довольно мало статей, зато почти все из них получили высокие рейтинги. Популярность web_monetization понятна — деньги интересны всем, ну, а примета времени — довольно высокое число просмотров у хаба it_immigration, в который за этот год было написано кстати, 86 статей, многие из них с довольно высоким рейтингом.
Раз уж речь зашла о рейтингах, можно построить статистику и по ним. Посмотрим, какое среднее количество голосов читателей набирают статьи в разных хабах:
На первом месте анонсы хабра — и это понятно. Остальное в принципе, видно из названий, все перечислять смысла нет. Можно лишь отдельно отметить довольно экзотический хаб demoscene, в котором обсуждаются странные штуки типа программирования на БК-0010, ну и уже вышеупомянутый brainfuck, который победил почти всех c практически двухкратным отрывом. И на удивление, в топ-10 попал Perl, хотя статей по нему в 2019 было довольно мало.
Раз уж речь зашла о программировании, перейду к грустной части. Многие авторы наверно замечали, что узконаправленные статьи по программированию на Хабре практически «не идут». И хотя это было на уровне ощущений, теперь это можно подтвердить статистически.
Увы, с популярностью статей по ЯП на Хабре в плане рейтингов все действительно довольно грустно:
В общем, было и так интуитивно понятно что статья про распознавание изображений в OpenCV никогда не догонит по рейтингам статью про мошенничество в Мегафоне, ну теперь этому есть статистическое доказательство. Хотя в качестве исключения, Perl (9 статей), Rust (61 статья) и Haskell (16 статей) держатся по средним баллам весьма неплохо.
Что в этом списке вообще делает Delphi (18 статей, в 2019 году!) не очень ясно, но оказывается, в хабе по нему некоторые археологи еще что-то пишут.
Кстати, если кому интересен рейтинг самых «унылых» хабов по числу голосов, то его тоже несложно вывести:
Интересно также объединить хабы в большие группы. Первая группа — хабы «не про программирование», куда можно отнести «карьеру», «гаджеты», «здоровье» и пр, из них я взял 10 самых популярных. Вторая группа — все хабы Geektimes, которых довольно много. Три остальные группы — профильные хабы, языки программирования и администрирование.
Результат предсказуем — «топовые» хабы получают наибольшие рейтинги, хабы Гиктаймс тоже вполне положительно оцениваются читателями, все остальное, увы, имеют заметный отрыв.
Кстати, стало интересно, как выглядели голоса статей по профильным хабам 10 лет назад, в далеком, 2009 м году.
Для понимания порядка величин, в хаб «Алгоритмы» тогда было написано 30 статей со средним рейтингом +67, сейчас написано 486 статей, но средний рейтинг упал до +29.
Заключение
Главный вывод — пора учить Brainfuck.
Статья задумывалась скорее «для прикола», чтобы посмотреть какие-то забавные закономерности, но в итоге получилась отчасти грустной. Хотя честно, я не хотел, и цель была не в этом. По крайней мере, ищущие темы новых статей для Хабра могут теперь делать это с более научным подходом, и выбирать хабы более осмысленно. Вряд ли я открыл Америку, скорее всего вышенаписанное все постоянные читатели и писатели Хабра интуитивно знали и так, но проверить статистически было интересно.
Ваш кэп.