Хабрастатистика: как Хабр пережил самоизоляцию

Привет, Хабр.

Заканчивается первая половина 2020 года, можно подвести некоторые статистические итоги, тем более что по понятным причинам, они обещают быть интересными. Появились новые темы для обсуждения, многие стали работать из дома, любопытно посмотреть, как это сказалось на количестве статей и их популярности.

a8pqauznjb-yts7vvctfm-cdnsm.png

Для тех кому интересно что получилось, продолжение под катом.

Для начала, традиционный disclaimer. Данная статистика, как и рейтинг, являются неофициальными, и не исключаю что я нигде не ошибся. Если кто-то не нашел себя в топе статей, но уверен что должен там быть, пишите в личные сообщения, поправлю. Данные по статьям собирались с помощью парсера на Python, который был запущен в один поток, чтобы не нагружать сервер. Такой сбор данных занимает примерно 8 часов, чтобы не держать ПК включенным, код был запущен на роутере с dd-wrt. Теперь вернемся к статистике.

На первом графике было показано общее количество опубликованным в 2020 году материалов. Тут по сравнению с 2019 годом обошлось без особых изменений — для постоянных авторов карантин на производительности не сказался (может они и до него из дома не часто выходили ;). Кстати, как можно видеть, в среднем в день на Хабр выкладывается порядка 60 публикаций. Примерно половина из них это корпоративные блоги, и наверно это хорошо для Хабра с точки зрения прибыли, но грустно с точки зрения читателя — все же материалы от независимых авторов лично мне нравятся больше. Есть конечно интересные корпоративные блоги, но в основном, рекламный материал есть рекламный. Там не будет исходников, каких-то know-how, а текст будет выверен службой безопасности чтобы не дай бог не сболтнуть ничего лишнего. Судя по графику, достаточно регулярно публикуются новости, ну, а англоязычный хабр… пока не «взлетел», больше про него ничего нельзя сказать.

Раз уж речь зашла об авторах, отметим тех, чье количество статей за эти полгода превышает 100: maybe_elf (464 статьи), denis-19 (349 статей), avouner (244 статей), AnnieBronson (229 статей), MaxRokatansky (170 статей), ru_vds (169), SLY_G (149) и PatientZero (107). Это примерно одна статья или новость в день, спасибо что благодаря вам (и остальным авторам конечно тоже), есть что почитать в свободное время.

Однако, вернемся к нашей самоизоляции. Посмотрим на число просмотров, оно уже интереснее:

mymhcptoquepata7pkmfrv0rqpq.png

Для сравнения можно сказать, что ни одна статья 2019 года не набрала и полумиллиона просмотров (даже статья про минет), а здесь мне впервые пришлось поменять форматирование чисел по вертикальной оси. И понятное дело, все статьи из топа посвящены, разумеется, коронавирусу. Отдельно стоит отметить первую статью, набравшую рекордные за всю историю Хабра 5 млн просмотров.

Итак, топ-10 статей по числу просмотров

  1. Коронавирус: почему надо действовать прямо сейчас, перевод от five, 5526000 просмотров, 2067 комментариев
  2. Ликбез по респираторам. Помогает ли респиратор от заражения вирусом. Обзор 11 респираторов от spygates, 1168000 просмотров, 133 комментария
  3. Коронавирус: опасная иллюзия смертности от ilusha_sergeevich, 959000 просмотров, 2162 комментария
  4. Коронавирус: как мы себя обманываем от ilusha_sergeevich, 669000 просмотров, 1048 комментариев
  5. Коронавирус 2019-nCoV. FAQ по защите органов дыхания и дезинфекции от steanlab, 547000 просмотров, 408 комментариев
  6. Сервисы, которые стали бесплатными на время карантина: курсы, радио, книги, кино и сериалы от baragol, 358000 просмотров, 61 комментарий
  7. Задержать COVID-19. Все про фильтрацию воздуха на случай пандемии от steanlab, 320000 просмотров, 284 комментария
  8. Коронавирусы: от SARS к 2019-nCoV от Meklon, 309000 просмотров, 1975 комментариев
  9. Коронавирус COVID-19: только факты, без паники от baragol, 289000 просмотров, 220 комментариев
  10. Коронавирус: филогения, курение, летальность и снижение рисков заболеть от elena_pastukhova, 254000 просмотров, 195 комментариев.


Думаю, Хабр и всех авторов вполне можно поздравить с вкладом в борьбе с эпидемией — возможно эти тексты спасли кому-то здоровье, а то и жизнь — суммарно почти 10 млн просмотров, это внушает. Кстати, на Хабре за эти полгода всего было написано 304 статьи, в названии которых встречается «covid»:

tuguexyof0zk87xkuwulie-57ia.png

Можно посмотреть распределение просмотров по хабам. Так было в 2019:

-ju8ikhuhiqpclcdnmfakxk_xvu.png

А так стало в 2020:

1oqkn6dmghqme4p54702bra0c9i.png

Раздел «health» переместился с 10й позиции на первую, потеснив «информационную безопасность», вместе с ним поднялись в рейтинге «popular science» и «biotech», которого в топе просмотров до этого вообще не было.

Впрочем, справедливости ради, если отсортировать статьи по числу комментариев, то Linux все же обошел коронавирус, что даже радует.

Топ-10 самых комментируемых статей

  1. Главная причина, почему не Linux от mrtux, 2401 комментарий, 139000 просмотров
  2. Коронавирус: опасная иллюзия смертности от ilusha_sergeevich, 2162 комментария, 959000 просмотров
  3. Коронавирус: почему надо действовать прямо сейчас от five, 2067 комментариев, 5526000 просмотров
  4. Разработчики — никакая не элита, а голые короли индустрии от chapuza, 1985 комментариев, 147000 просмотров
  5. Динамическая типизация — это не инструмент для разработки. Это чепуха (паршивая) от fillpackart, 1977 комментариев, 66500 просмотров
  6. Коронавирусы: от SARS к 2019-nCoV от Meklon, 1975 комментариев, 309000 просмотров
  7. Пользователю все это не нужно! Хватит пропагандировать Линукс от tmat, 1365 комментариев, 81100 просмотров
  8. В софте всё восхитительно, но все недовольны от phillennium, 1288 комментариев, 41700 просмотров
  9. Пора на свалку от 0xd34df00d, 1245 комментариев, 125000 просмотров
  10. Заметки о жизни в США от pavgra, 1207 комментариев, 110000 просмотров.


Многим авторам наверно будет интересно посмотреть распределение рейтинга статей:

dawdknlkobtpe3ealyfl1adpkby.png

Тут есть странный момент, который мне непонятен, и не исключаю что я нигде не ошибся. В этом году средний рейтинг, как можно видеть, снизился — пик сместился влево. Ощущение такое, что большинство статей просто не успевают читать, они не набирают даже +10 баллов. Учитывая что гонорар за статью зависит от рейтинга, это довольно грустно — все же, хотелось бы видеть на Хабре больше независимых авторов.

Вернемся к рейтингу. Интересно посмотреть на топ-10 статей по добавлению в закладки. Тут слава богу, про covid уже ни слова:

  1. Подготовка к собеседованиям в IT-гиганты: как я преодолела проклятье алгоритмического собеседования от greenEkatherine, 124000 просмотров, 1355 закладок
  2. Какие английские слова IT-лексикона мы неправильно произносим чаще всего от YuriyIvon, 143000 просмотров, 1135 закладок
  3. Как я чуть не выкинул 150к на ветер или история установки приточной вентиляции в квартире от jirfag, 168000 просмотров, 1028 закладок
  4. Как стать долларовым миллионером за 30 лет, лежа на диване от SergioShpadi, 161000 просмотров, 1010 закладок
  5. Полная домашняя автоматизация в новостройке от empenoso, 163000 просмотров, 949 закладок
  6. Как научиться разработке на Python: новый видеокурс Яндекса от orlovdl, 80100 просмотров, 908 закладок
  7. 10 интересных репозиториев на GitHub, полезных любому разработчику от Plarium, 57300 просмотров, 894 закладки
  8. 70 вопросов по JavaScript для подготовки к собеседованию от aio350, 94900 просмотров, 857 закладок
  9. Zip-файлы: история, объяснение и реализация от AloneCoder, 50400 просмотров, 703 закладки.


И наконец, последний рейтинг по соотношению добавлений в закладки к числу просмотров.

  1. Руководство по FFmpeg libav от ThomasAlva, 268 закладок, 11700 просмотров
  2. Как облегчить себе жизнь при использовании Git (а также подборка материалов для глубокого погружения) от pxeno, 369 закладок, 17100 просмотров
  3. Современные стандарты идентификации: OAuth 2.0, OpenID Connect, WebAuthn от AlexeySushkov, 225 закладок, 11100 просмотров
  4. 9 четких инструментов для изучения и прокачки английской лексики от EnglishDom, 230 закладок, 11900 просмотров
  5. Имитируем сетевые проблемы в Linux от azakharenko, 343 закладки, 18100 просмотров
  6. Отслеживаем прогресс выполнения в Python от germn, 430 закладок, 23000 просмотров
  7. Простое обнаружение проблем производительности в PostgreSQL от puyol_dev2, 212 закладок, 11400 просмотров
  8. 45 youtube-каналов на английском языке для ИТ-специалистов от vesyolkinaolga, 209 закладок, 11300 просмотров
  9. 10 React-компонентов на все случаи жизни от ru_vds, 306 закладок, 17400 просмотров
  10. Визуальная теория информации (часть 1) от stabuev, 214 закладок, 12200 просмотров.


Заключение


С уверенностью можно сказать, что наверное как и многие другие ИТ-сервисы, Хабр и его авторы, пережили пандемию без существенных потерь. Всех кто попал в топ поздравляю, следующий рейтинг будет в конце 2020 года. Ну, а читателям надеюсь, есть что пересмотреть, если какие-то материалы были пропущены.

© Habrahabr.ru