Хабростатистика, часть 2 — опровержение с графиками
Вчера я публиковал статью на тему того, когда лучше публиковаться на хабре. С тех пор мой паук собрал статистику за весь 2015 год, и картинка немного изменилась. Так же я построил несколько графиков, и в целом картина прояснилась. Осторожно, трафик!
Сначала посмотрим статистику отдельно по каждому дню:
Обозначения на графиках такие:
- Quantity — количество опубликованных в это время статей
- Comments — среднее количество оставленных комментариев
- Views — среднее количество набранных просмотров
- Rate — средний набранный рейтинг
Понедельник выглядит так:
Вторник:
Среда:
Четверг:
Пятница:
Суббота:
Воскресенье:
Ну и наконец самое вкусное — сборная солянка за всю неделю:
Придётся признать — полученная статистика несколько противоречит мнению, которое я высказал в первой статье. Действительно, как упоминали некоторые комментаторы, лучше всего публиковаться в субботу и воскресенье в 5 часов утра, когда конкуренция с вашей статьёй минимальна.
Или нет?
А давайте посмотрим выборки по получившимся пикам:
Для начала — 6 утра субботы.
SELECT * FROM posts WHERE WEEKDAY(created)+1=6 AND HOUR(created)=6
Результат:
id | created | rate | comments | views |
255509 | 2015–04–11 06:28:00 | 58 | 104 | 74000 |
250557 | 2015–02–14 06:21:00 | 46 | 19 | 23000 |
238363 | 2014–09–27 06:14:00 | 79 | 29 | 56000 |
233533 | 2014–08–16 06:08:00 | 87 | 95 | 52000 |
228751 | 2014–07–05 06:58:00 | 108 | 70 | 38000 |
Затем — в воскресенье в 5 утра.
SELECT * FROM posts WHERE WEEKDAY(created)+1=7 AND HOUR(created)=5
id | created | rate | comments | views |
274457 | 2016–01–03 05:02:00 | 16 | 0 | 3000 |
256063 | 2015–04–19 05:34:00 | 33 | 15 | 15000 |
249407 | 2015–02–01 05:58:00 | 93 | 157 | 66000 |
228811 | 2014–07–06 05:23:00 | 23 | 4 | 7000 |
224805 | 2014–06–01 05:59:00 | 143 | 20 | 23000 |
Вот так. Довольно очевидно, что единичные посты делают нашу статистику. И, хотя я не могу не признать, что некоторое влияние время публикации всё же оказывает — оно не стоит того, чтобы даже задумываться об этом.
А смотреть графики — очень опасно. Графики дают ложные иллюзии понимания и некорректные предпосылки. Поэтому жизненно важно всего понимать, какие данные и по какой причине лежат под вашими графиками. Иначе всё, что вы построите и сделаете, будет иметь под собой примерно