Скучные цифры статистики и невнятная попытка их показать

51e66ced207e92dd3feda75d6dbe9a06

С огромным интересом прочитал в чулане и статью и дискуссию про MHGA — Make Habr Great Again, и имею мнение, с некоторыми цифрами.

Для лиги лени: интернет изменился, и фарш невозможно провернуть назад. С автором статьи про MHGA не согласен.

Источники цифр — статистика Хабра по годам.
2023 год Хабр — Итоги 2023 года
2022 год Итоги 2022 года на Хабре
2021 год — не нашлось
2020 — Хабрарейтинг 2020: статистика и рейтинг лучших статей за 2020 год
2011–2019 быстро не нашлось, кроме
2016 — Два по сто: самые читаемые статьи и авторы Хабра и ГТ
2010 год — О Хабрахабре, статистике и тортах

Хорошо бы еще чрез пруд выстроить каменный мост, на котором бы были по обеим сторонам лавки, и чтобы в них сидели купцы и продавали разные мелкие товары, нужные для крестьян собрать статистику по месяцам через парсер выборки статей отсюда
Или пойти глубже — взять случайного пользователя, и через статистику пользователя  собрать статистику по юзерам и посмотреть, насколько у них много статей с +100.
Неплохую статистику дает топ «завсегда» — https://habr.com/ru/articles/top/alltime/
Можно выдрать статистику из профилей комментаторов статей, интересно наблюдать статус типа «это что за имитатор деятельности, или же это консерва», но что это даст, если механизмов влияния на состояние — нет? Про механизмы влияния чуть ниже.

Это уже было в 2010:
Если реально толковое, так оно подавляющему большинству местной публики нах не надо.
Классика
habrahabr.ru/blogs/infosecurity/80842/#comment_2387143
Они даже не поймут о чем написано и зачем это надо.
Им или подавай про йух или на пальцах перепевы мануалов, на которые восторженные отклики «в мемориз». Мануалы — это же так скучно, а буууукафф там… А тут тебе разжевали и в ротик положили. Думать не надо, ну и не умеют.
Положительных эмоций от написания действительно хорошей статьи получить практически нереально, вот и не пишут, и не будут.
(сорс)

Часть 1. Уровень проникновения и влияния интернета, конкуренты.
Хабр начинал как закрытая социальная сеть с приглашениями\инвайтами, где изначально ставились высокие требования к профессионализму \ качеству. К чему это привело? Число всех ИТ шников «в стране» можно представить как примерно 1 программист, 1 дизайнер, 1 сетевик, 1 администратор, 1 смм щик, и 0.1 девопса на 100 человек работающего населения. 5.1 человек на 100, в лучшем случае. Есть еще АСУ ТП на комбинатах, есть магистральные линии связи, есть АСУ ЕС РФ. Рассмотрим абстрактный объект такого рода — город Песецк.
ГОРОД ПЕСЕЦК
В славном российском городе Песецк живет 140 тысяч человек. Из них 23 тыс. детей, 30 тыс. пенсионеров, 67 тыс. вроде бы занято в экономике. Где болтаются еще 20 тыс., Госкомстату неведомо; часть вроде бы учится, кто-то сидит. Из тех, кто занят в экономике, в образовании 6000, в медицине 4500, на транспорте 5500, в торговле 12 тыс., в сфере услуг 6000, в коммуналке 4500, в строительстве 5000, пытаются что-то вырастить на почти вечной мерзлоте 7000, управленцев 3500, в банках — 1000. Раньше был комбинат, там 12 тыс. работало, но закрылся в силу многолетнего отсутствия спроса. Но и без него безработица всего 18%, невысокая по кризисным стандартам. То есть люди работают, город живет.
На такой город придется, в лучшем случае, 10/100 человек, так или иначе причастных к ИТ, связи, электричеству, etc — на 67 к это будет 6.7 к. Из них что-то сложнее докладной «почему так вышло» может 1/10, а хочет это делать — 1/100. Потому что время, потому что сложно, потому что заминусуют. После этой нехитрой математики останется 0.067 к — 67 человек. Теоретически огромная база для социальной сети, практически участие в этой социальной сети не дает социальных бонусов без резких изменений в жизни. Говоря простым языком, за статьи на Хабре не будут доплачивать каждый месяц, и, значит — зачем ими заниматься ?

Как это выглядит в цифрах из статей выше.
2010 год —
Итак, «спорной» я назвал статью, у которой количество «минусов» составляет более трети от общего количества оценок.
как видно на графике, статьи уверенно набирали 500–800. Если посмотреть лучшие статьи за все время —

2009 — плюс 1154
2010 — плюс 564 \ 560 \
2011 — плюс 1448 \ плюс 913 \ плюс 603
2012 — плюс 652
2013 — плюс 782 \ плюс 753 \ плюс 661 \ 581
2014 — плюс 724 \ плюс 611
2015 — плюс 434
2016?
2017?
2018 — плюс 443 \ плюс 426 (это новость про возврат гиктаймс)
2019 — плюс 791 \ плюс 622 \ плюс 619
2021 — плюс 1447 \ плюс 610 \ плюс 588
Если же взять статистику 2022 — 2023, то окажется , что 
2020 — плюс 497 \ плюс 480 \ плюс 447
2021 — плюс 579
2022 — плюс 587 \ плюс 559 \ плюс 472 \
2023 — плюс 459 \ плюс 440 \ плюс 394

На эти цифры — падение статистики плюсцов с 600 в 2021 до 450 в 2023 надо наложить следующее:
Всего на Хабре зарегистрировано 1 581 750 пользователей:
116 540 — Полноправные (сорс)

То есть, на 100к пользователей с правом голоса — голосуют (за статьи) меньше 500. В 2010 людей было явно меньше, а голосов явно больше, как так?.
Поток просмотров крутится — под 300 миллионов совокупных просмотров в год, разве плохо? Хорошо.
Но есть нюансы. Например, почему в выборку топ статей из выбранных первых условно 20 — не попали 2015–2018 (то есть попали, но с 5й страницы)? То есть, рейтинг актуализирован на сейчас, и удаленные статьи признанной врагами народа организации из рейтинга убраны ? Или как?

Суммируя вышесказанное, можно сказать что мнение «уже не торт» не только не ново, но и опирается на цифры — авторы с правом голоса — голосуют путем «не-написания» и «не-голосования».

Заход с другой стороны, а куда делись русскоязычные авторы и делись ли они только с хабра?
Ответ простой: На 2010–2012 год существовало около 100 (ста) русскоязычных блогов по ИТ по интересным мне темам. Можно утроить эту цифру, потому что тогда я не интересовался плюсами, питоном и SDLC, а блоги — наверное, были. Тем не менее, я ленюсь проверять эту гипотезу путем поиска бОльшей выборки. Почему? Потому что перепроверка даже сотки ресурсов займет примерно 300 минут \ 5 часов вручную. Почему вручную? Вручную сделать анализ «когда были три последние заметки» проще, чем писать автоматизацию под 20 платформ.
Я не буду описывать умершие в связи с разными причинами офлайн сообщества типа UCC или SQL, частично переехавшие в телеграмм, но умершие и там.
И что вообще осталось из офлайн сообществ в РФ, кроме Highload?

Заход сбоку, что там у Пикабу?
Там все хорошо, от 5к до 15к плюсов от активных пользователей,  200–500к просмотров, индексация, рожь, овощи, вот это все. Даже такой паршивый автор, как я — набирает по 2к плюсов и 20–100 к просмотров. Ничего удивительного, что там в каждом первом сообщении «вот мой телеграмм канал и вот моя яндекс кошелек» — бизнес молодость сама себя не омолодит. Заметьте, не вот мой блог на VC \ medium \ TJ –, а телеграмм.

Заход слева, что там в телеграмме?
pikabu — 260k
habr — 72k
tophr — 15к человек, вот так вот.
itrecruitergroup — 12к
clickhouse_ru — 9.2к (странно, откуда столько народа занимающегося clickhouse?)
dba_ru — 3.8к
остальные мелкие, и не всегда доходят до 2к человек. Или я поленился найти более большие и активные группы.

Выводы.
Я хотел написать статью в стиле «шеф все пропало ааа мы все умрем», но в процессе сбора цифр понял, что ситуация сложнее. «Массы» ИТ-шников, которые просто работают, не делятся опытом, не пишут ничего сложнее helm чарта — никуда не делись, живы. Число желающих делиться опытом в формате, который предлагает Хабр (бесплатном и без сотни лайков за техническую статью) — не похоже, чтобы росло. Так, в блогах организации иногда проскочит что-то. Если рисовать пирамиду и пробовать сделать какую-то аналитику, типа кто из участников тематических сообществ ведет какой-то свой — индексируемый — блог, и кто из них ведет \ пишет что-то на Хабре — получатся крайне перекошенные пирамиды, потому что по ряду тем на Хабре вообще нет статей. Навскидку — про (сгнившую на улице) линию AMD Fab 30 рассказывает только Горшенин и только в видео на IT Elements, а не в рассказе про прогресс от сделаноунас из 2013 к новости про этап банкротства — «Ангстрем» проиграл суд на 1,3 млрд евро. Точно так же на Хабре нет базовой — сформированной сообществом — методики для тестирования аппаратных компонентов по качеству \ удобству \ скорости, илипрограмно-аппаратных комплексов по хотя бы удобству использования. Исключения 1–2. Возможно, в связи с полным отсутствием микрокомпонентов российского производства? Или, возможно показывать какой там чип положили в новые загранпаспорта — просто стыдно?

Лично для себя я определяю сложившуюся ситуацию «в целом», как архаизацию и возврат в СССР с точки зрения общественных \ групповых отношений.
Архаизация:
выражается в том, что знания становятся более догматичными. То есть, идет переход от образа мыслей «мы делаем вот так, потому что (список факторов), и не делаем вот так, потому что (другой список)» к «мы делаем вот так потому что тяжесть хорошо, тяжесть это надежно». Подмена знаний — догмами. Как и во всем обществе, впрочем. Когда программа «повышения технического суверенитета» превращается в «надо плюс сто храмов, а не плюс сто физмат кружков на Москву».
Возврат в СССР:
В позднем (80е) СССР знания «вокруг ИТ» были во первых сосредоточены в нескольких, весьма немногих, организациях, во вторых — как верно замечено в комментариях — оплачивались на уровне линейного инженера. Каковым, впрочем, и были. Это при массовой пропаганде, как же нужен и важен инженегр или врач или учитель, уважение вместо оплаты труда или квартиры вне очереди. В третьих, инженерные знания зачастую были жестко привязаны к конкретной модели ЭВМ, и конкретному набору окружения. В отсутствие давления со стороны западного рынка труда — ситуация будет сводиться к той же олигополизации рынка, где «оплачиваемых выше среднего» рабочих мест очень мало, но про это я уже отдельно написал.

Теперь по поводу статьи в чулане.
Я в комментариях отметил, что не согласен с частью статьи в чулане, и попробую —  с учетом сказанного выше — раскрыть тему, а то видите ли кому-то (судя по минусам — целым 43 гражданам) не понятно, не комфортно и страдает их чувство прекрасности и принадлежности к элитарному. И даже, какой ужас, подвергается смутному сомнению величие и незыблемость Хабра самого по себе.
Хабр в статье описан как ресурс для программистов, что-то там создавший. Может, кому-то и создавший, но cnews, ixbt, LOR (linux.org.ru), 1с-ные форумы и forum.mista.ru, как и русская часть Microsoft Community жила до Хабра, живет и теперь. Хабр это не reddit и даже не пикабу по охвату, не stackoverflow по уровню поддержки комьюнити, это — в здесь и в сейчас — площадка для размещения чего-то длинно-читаемого в блогах русских компаний. Причем, как показывают примеры, размещения чего угодно. Соответствующего, не соответствующего, не важно. Новостей про регистрацию троллейбуса из буханки в форме кибертрака, например.
При этом совершенно упускается тот факт, что как не размещай свою скрытую рекламу сбермаркет или МТС — они все равно не перебьют волну негатива после их бизнес-процессов с прокидывание покупателей, сменами тарифов и так далее. Ну да, внутри у %% может быть какой-то хороший процесс тестирования. Как это влияет на то, что у них постоянно то тариф вырастет, то переход к другому оператору не работает, то денег спишут за что-то. То же самое касается %% банка — с их втюхиванием страховок и скрытыми списаниями.
Точно так же я очень скептично отношусь к заявлению «хабр задает тренды» . Тренды в РФ задаются обществом и правительством РФ. Хабр, нарушая все 9.5 принципов, на хабре же и опубликованном еще в 2012 году (сами правила из 2010 года), трендам следует, а не задает. Тренды же следующие — писать только официально одобренное ранее, только хорошее (как на сделаноунас), и не писать потенциально опасное. Возможно, именно поэтому на хабре нет статей про MAES-512/xor49 и AES256 — это помешает кое-чьему серьезному бизнесу по поставкам наклеек из Китая. Хотя это про ИТ и российскую разработку (якобы) и микроэлектронику (нет). Нет анализа доклада Silicon Lifeline: Western Electronics at the Heart of Russia’s War Machine, потому что кому-то будет больно, даже не смотря на то, что его не надо переводить, он на русском есть. Точно так же нет масс рассказов от комьюнити «как живется айтишнику за границей» — хотя часть комьюнити успешно переехала и обосновалась, потому что может оказаться, вопреки официальным новостям, что «там» парады запрещенной в РФ — не каждый день, а раз в неделю.
Можно сказать, что с 2006 Хабр прошел путь от попытки формирования социальной сети для программистов и немного тестеров, к агрегатору новостей от российского бигтеха. Даже без попыток перевода мировых новостей с, хотя бы, bleepingcomputer.
Работает ли такой метод ? да, за пару лет статьи совокупно набирают под 300 миллионов просмотров —
В прошлом году было 30 581 публикация на 212 миллионов просмотров (на момент написания публикации, то есть 25 декабря 2022). Однако если выгрузить данные за 2022 сейчас, то окажется, что статьи суммарно набрали уже 285 миллионов просмотров (я предполагал, что будет за 300) — то есть за год на публикации 2022 года набежала дельта в 73 миллионов просмотров! (сорс) — так что, о чем переживать? О том, что статьи стали унылое корпоративное какао и это видно в цифрах лайков? Ну и что? Главное, чтобы деньги платили. За корпоративный блог. Будет надо — будут и статьи про то, как похорошело российское ИТ с приходом иностранных специалистов Мастурбека, Равшана и Джамшута. Потому что альтернатива — или 50–75% прямой и скрытой рекламы, как на Пикабу, плюс цензура, или платная подписка на такие же унылые размазанные корпоративные сопли. А платить, тем более за негарантированное хорошее настроение — мало кто готов. Хотя, статьи насяльника, я сервера поставил, фрибздя на него накатиль, апачи воткнуль, пахапе к нему приделяль, шапускаю. А оно эшембе, бешельме, шайтанама, бестамбе!  — на хабре уже есть, причем в корпоративном блоге.

© Habrahabr.ru