Выборы-2016. Часть 2 — удивительное рядом и оно разрешено
В первой части статьи о выборах 2016 года шла речь о результатах в 225 избирательных округах. В этот раз рассмотрим данные о результатах голосования по участковым избирательным комиссиям (УИК), которых насчитывалось чуть менее 100 тысяч. Этот уровень детализации позволяет увидеть неожиданные явления и удивительные закономерности в результатах голосования.
Данные
Мы будем рассматривать только результаты выборов по партийным спискам — пропорциональная составляющая голосования. Сведения о результатах голосования для каждого УИКа предоставляются Центризбиркомом в несколько разрозненном виде. В агрегированном виде данные собраны и распространяются Сергеем Шпилькиным (ссылка).
Общее число участков на этих выборах составило 96871. В этих данных для каждого УИКа приводятся данные о числе избирателей, проголосовавших за партии, участвовавших в выборах. Вместо числа избирателей переходим к процентному представлению результатов партий с точностью до 0.01%. Сумма результатов в каждом УИКе по всем партиям, с учетом процента испорченных бюллетеней, должна быть равна в точности 100.00%. Для округления процентных результатов используем метод наибольшего остатка — наиболее известный подход. ЦИК использует другой метод округления процентных результатов, сведения о котором я не нашел. И по крайней мере этот метод не совпадает ни с одним из алгоритмов представленных в библиотеке sfsmisc
. Поэтому, в некоторых случаях, используемые процентные результаты могут отличаться от данных ЦИК на 0.01%, но это не играет принципиальной роли. Результаты явки тоже выражены в процентах с точностью до 0.01% (использовалось обычное округление).
Пятно
Отображаем полученные данные на диаграммах рассеяния, в которых точками являются — УИКи.
На графике ниже показаны результаты явки и партии «Единая Россия» по всем УИКам.
На этой диаграмме обращает на себя внимание черная точка в районе явки с 65 процентами и результатом «Единой России» примерно в 60 процентов. Эта точка означает высокую концентрацию УИКов с очень близкими результатами по этим двум осям графика.
Для двух диаграмм с осями «Явка — КПРФ», «Явка — ЛДПР» по-прежнему наблюдаем черную точку с той же явкой.
И даже для непарламентских партий, например, для «Коммунистов России» это точка продолжает сиять.
Впрочем, и для остальных партий это явление можно также наблюдать. Дальше — больше, посмотрим что это за участки. Зададим диапазон более точно — явка в пределах от 64.26% до 64.33%, результат «Единой России» от 62% до 62.5%. В указанные границы попадает 60 УИКов. И, какое неожиданное совпадение, все они из Саратовской области!
Этот феномен был обнаружен еще до утверждение результатов выборов. К сожалению, представители ЦИК, в том числе и его председатель, поспешили заявить, что ничего удивительного в этом явлении нет. Поэтому проверка по этому случаю не проводилась.
Линейные зависимости
На графики с осями «КПРФ — ЛДПР» прослеживаются прямые вида y = x и y = 2*x.
Более отчетливо линейные зависимости с целыми коэффициентами видны, например, для пары «Коммунисты России — Яблоко».
Нельзя сказать, что это вклад какого-либо определенного региона (точек на этих прямых слишком много). Но почувствовать некоторую разницу можно на примере Москвы и Московской области.
Или вот график для пары «Коммунисты России — Справедливая Россия» в квадрате 10% на 10% с сериями y = x, y = 2x, y = 3x и x = 2*y
По какой причине выделяются эти линейные зависимости с целыми коэффициентами?
Мне не приходит на ум какого-либо логичного объяснения этим закономерностям в результатах голосования.
Бимодальность
Это характеристика результатов голосования в Госдуму хорошо известна и по предыдущим выборам. Высокая явка избирателей на участке, как правило, свидетельствует о высоком результате «Единой России». Особенно отчетливо это проявляется в районе точки (100%, 100%). Такое уникальное сочетание гражданской ответственности и единомыслия избирателей на этих участках не перестает обращать на себя внимание.
Ниже два графика сглаженной плотности точек для партий «Единая Россия» и «ЛДПР»
«Красивые» цифры явки
На выборах 2011 года число УИКов с явкой в 60, 70, 80, процентов резко возрастало по сравнению с остальными участками (и явкой меньше 100%). На выборах 2016 года таких резких перекосов не наблюдается, за исключением явки в 50%. На графике ниже бин равен 0.1%, результат 100% явки — 2813 участка, исключен для наглядности представления остальных данных.
Как поработать с графиками самостоятельно
Все графики построены в R с использованием библиотек shiny
и ggplot2
. Это пример страницы приложения.
Если у вас установлен R, то, загрузив библиотеки shiny и pacman, вы можете запустить приложение командой:
shiny::runGitHub("e-chankov/elections_2016_uik")
Или же просто взять R-скрипты с GitHub.
Комментарии (3)
24 октября 2016 в 00:45
0↑
↓
Рискну предположить, что прямые
y = k*x
на графиках совместных результатов двух партий можно наблюдать для непопулярных партий на маленьких УИКах с небольшим числом избирателей. Вот что получается.Пусть у партии А будет 5 голосов, у партии Б — 10.
Теперь немного поварьируем размер участка — 50, 60, 70 и т.д.
Получим результаты партий10%/20%
,8,3%/16,6%
,7,1%/14,2%
и т.д.
Результаты ложатся на прямуюy = 0,5*x
, с возрастающей плотностью в районе точки(0, 0)
.Аналогично, изменяя изначальное соотношение голосов, получим прямые с другим коэффициентом k, густо закрашенные в начале координат и растворяющиеся вдали.
Чем больше участок и чем больше вариативность предпочтений избирателей, тем хуже будет видно такие прямые. Поэтому в Москве вы их не увидели, в МО уже что-то заметно, а, условно, в Лаганском районе Калмыкии их будет видно четко.
P.S. Это гипотеза, я не проверял.
24 октября 2016 в 00:47
+3↑
↓
Ещё одно подтверждение того, что люди плохо справляются с генерацией случайных чисел?
Хотя для большей достоверности было бы круто яркость/прозрачность точек регулировать в зависимости от количества избирателей на участке.24 октября 2016 в 01:25
0↑
↓
Про линии, имхо, вполне объяснимо, если учесть, что проценты — это фактически дроби, т.е. квантуются по количеству участников. Если на участок пришло десять человек, то за альтернативные партии будут либо 0, либо 10, либо 20 процентов — вот вам линии. Как будут выглядеть графики, если отсечь участки с числом голосов меньше N для разумно выбранного N?
Вообще интересно построить гистограмму кол-ва зарегистрированных на участке человек. Сколько участков с числом голосователей меньше 10? А меньше 100?