Выборы-2016. Часть 2 — удивительное рядом и оно разрешено

В первой части статьи о выборах 2016 года шла речь о результатах в 225 избирательных округах. В этот раз рассмотрим данные о результатах голосования по участковым избирательным комиссиям (УИК), которых насчитывалось чуть менее 100 тысяч. Этот уровень детализации позволяет увидеть неожиданные явления и удивительные закономерности в результатах голосования.


5c68ed28fbfd4fe49d0716d75495d061.png

Данные


Мы будем рассматривать только результаты выборов по партийным спискам — пропорциональная составляющая голосования. Сведения о результатах голосования для каждого УИКа предоставляются Центризбиркомом в несколько разрозненном виде. В агрегированном виде данные собраны и распространяются Сергеем Шпилькиным (ссылка).


Общее число участков на этих выборах составило 96871. В этих данных для каждого УИКа приводятся данные о числе избирателей, проголосовавших за партии, участвовавших в выборах. Вместо числа избирателей переходим к процентному представлению результатов партий с точностью до 0.01%. Сумма результатов в каждом УИКе по всем партиям, с учетом процента испорченных бюллетеней, должна быть равна в точности 100.00%. Для округления процентных результатов используем метод наибольшего остатка — наиболее известный подход. ЦИК использует другой метод округления процентных результатов, сведения о котором я не нашел. И по крайней мере этот метод не совпадает ни с одним из алгоритмов представленных в библиотеке sfsmisc. Поэтому, в некоторых случаях, используемые процентные результаты могут отличаться от данных ЦИК на 0.01%, но это не играет принципиальной роли. Результаты явки тоже выражены в процентах с точностью до 0.01% (использовалось обычное округление).


Пятно


Отображаем полученные данные на диаграммах рассеяния, в которых точками являются — УИКи.
На графике ниже показаны результаты явки и партии «Единая Россия» по всем УИКам.


aa195e7477664873b0f5047b37bb5e45.png

На этой диаграмме обращает на себя внимание черная точка в районе явки с 65 процентами и результатом «Единой России» примерно в 60 процентов. Эта точка означает высокую концентрацию УИКов с очень близкими результатами по этим двум осям графика.


Для двух диаграмм с осями «Явка — КПРФ», «Явка — ЛДПР» по-прежнему наблюдаем черную точку с той же явкой.


06d83f22e5464cea811f573bdef68fcf.png

64dea43873914d8a95412c09e3d9a66a.png

И даже для непарламентских партий, например, для «Коммунистов России» это точка продолжает сиять.


0a7fe3f61b234dd9b919b9b36c6678de.png

Впрочем, и для остальных партий это явление можно также наблюдать. Дальше — больше, посмотрим что это за участки. Зададим диапазон более точно — явка в пределах от 64.26% до 64.33%, результат «Единой России» от 62% до 62.5%. В указанные границы попадает 60 УИКов. И, какое неожиданное совпадение, все они из Саратовской области!


Этот феномен был обнаружен еще до утверждение результатов выборов. К сожалению, представители ЦИК, в том числе и его председатель, поспешили заявить, что ничего удивительного в этом явлении нет. Поэтому проверка по этому случаю не проводилась.


Линейные зависимости


На графики с осями «КПРФ — ЛДПР» прослеживаются прямые вида y = x и y = 2*x.


d1c556d0cc364d43ad04f5db8346eb5c.png

Более отчетливо линейные зависимости с целыми коэффициентами видны, например, для пары «Коммунисты России — Яблоко».


fd7146ed4c3a40efb24ebe77c7504465.png

Нельзя сказать, что это вклад какого-либо определенного региона (точек на этих прямых слишком много). Но почувствовать некоторую разницу можно на примере Москвы и Московской области.


6a50fd5426194b4face87c3481719577.png

49b13645deea4bdda45007b1c82f6737.png

Или вот график для пары «Коммунисты России — Справедливая Россия» в квадрате 10% на 10% с сериями y = x, y = 2x, y = 3x и x = 2*y


fb87634213964345ade6f9b45771c7c7.png

По какой причине выделяются эти линейные зависимости с целыми коэффициентами?
Мне не приходит на ум какого-либо логичного объяснения этим закономерностям в результатах голосования.


Бимодальность


Это характеристика результатов голосования в Госдуму хорошо известна и по предыдущим выборам. Высокая явка избирателей на участке, как правило, свидетельствует о высоком результате «Единой России». Особенно отчетливо это проявляется в районе точки (100%, 100%). Такое уникальное сочетание гражданской ответственности и единомыслия избирателей на этих участках не перестает обращать на себя внимание.


Ниже два графика сглаженной плотности точек для партий «Единая Россия» и «ЛДПР»


19a8d70ee5674b58853ac8c58849e5ec.png

1ed0f7dd55e84fa5bf2c035673b65aca.png

«Красивые» цифры явки


На выборах 2011 года число УИКов с явкой в 60, 70, 80, процентов резко возрастало по сравнению с остальными участками (и явкой меньше 100%). На выборах 2016 года таких резких перекосов не наблюдается, за исключением явки в 50%. На графике ниже бин равен 0.1%, результат 100% явки — 2813 участка, исключен для наглядности представления остальных данных.


3f4a54fb2e26421e9e52ce8364b6b5cc.png

Как поработать с графиками самостоятельно


Все графики построены в R с использованием библиотек shiny и ggplot2. Это пример страницы приложения.


6702cfbc20e1419daf83728a4efa991c.png

Если у вас установлен R, то, загрузив библиотеки shiny и pacman, вы можете запустить приложение командой:


shiny::runGitHub("e-chankov/elections_2016_uik")

Или же просто взять R-скрипты с GitHub.

Комментарии (3)

  • 24 октября 2016 в 00:45

    0

    Рискну предположить, что прямые y = k*x на графиках совместных результатов двух партий можно наблюдать для непопулярных партий на маленьких УИКах с небольшим числом избирателей. Вот что получается.


    Пусть у партии А будет 5 голосов, у партии Б — 10.
    Теперь немного поварьируем размер участка — 50, 60, 70 и т.д.
    Получим результаты партий 10%/20%, 8,3%/16,6%, 7,1%/14,2% и т.д.
    Результаты ложатся на прямую y = 0,5*x, с возрастающей плотностью в районе точки (0, 0).


    Аналогично, изменяя изначальное соотношение голосов, получим прямые с другим коэффициентом k, густо закрашенные в начале координат и растворяющиеся вдали.


    Чем больше участок и чем больше вариативность предпочтений избирателей, тем хуже будет видно такие прямые. Поэтому в Москве вы их не увидели, в МО уже что-то заметно, а, условно, в Лаганском районе Калмыкии их будет видно четко.


    P.S. Это гипотеза, я не проверял.

  • 24 октября 2016 в 00:47

    +3

    Ещё одно подтверждение того, что люди плохо справляются с генерацией случайных чисел?
    Хотя для большей достоверности было бы круто яркость/прозрачность точек регулировать в зависимости от количества избирателей на участке.

  • 24 октября 2016 в 01:25

    0

    Про линии, имхо, вполне объяснимо, если учесть, что проценты — это фактически дроби, т.е. квантуются по количеству участников. Если на участок пришло десять человек, то за альтернативные партии будут либо 0, либо 10, либо 20 процентов — вот вам линии. Как будут выглядеть графики, если отсечь участки с числом голосов меньше N для разумно выбранного N?
    Вообще интересно построить гистограмму кол-ва зарегистрированных на участке человек. Сколько участков с числом голосователей меньше 10? А меньше 100?

© Habrahabr.ru