Выборы президента США глазами математика. Что произошло за последний месяц?

Чуть больше месяца прошло с выхода статьи Избирательная система США глазами математика. Судя по количеству просмотров за прошедшее время, эта тема достаточно интересна читателям Хабра. В соответствии с результатами проведенного голосования, в котором с небольшим преимуществом победили желающие видеть на Хабре продолжение темы, выполняем это желание. Тем более, февраль подошел к концу и вполне естественно проанализировать итоги месяца. В этой и последующих публикациях будем также разбирать по одной математической теме, в том числе, с азами статистики и теории вероятностей.


Прежде всего, немного математики насчет того, как правильно оценивать результаты опросов, поскольку именно эти цифры лежат в основе всех суждений и прогнозов.

Как оценивать точность опросов? Бросаем монету.

Проведение опроса общественного мнения типа Ты за большевиков али за коммунистов? «Вы за демократов или за республиканцев?», с точки зрения теории вероятности, то же самое, как кидать немного несимметричную монету, и по результатам выпадения орла или решки оценить, в какую строну у монеты «перекос». Сильно погружаться в статистику и терию вероятостей мы не будем, а только обсудим, насколько точно результаты таких испытаний отражают реальную ситуацию. В опросах отдельно по штатам США обычно участвует от 500 до 1500 респондентов, а в национальных опросах — от 1000 до 6000. Обычно результаты публикуются в виде, представленном на рис. 1, и в них всегда или почти всегда указывается погрешность.

Рис 1. Результаты опросов по штату Висконсин. Источник - https://www.270towin.com

Рис 1. Результаты опросов по штату Висконсин. Источник — https://www.270towin.com

Разберемся, что она означает.
Если рейтинги кандидатов не сильно отличаются от 50%, то для грубой оценки задачу можно сформулировать проще. Предположим наша гипотетическая монета абсолютно симметрична, т.е. вероятность выпадения орла или решки ровно по 50%. Вопрос следующий — какова вероятность того, что при выполнении, например, 1000 бросаний, отклонение суммарного результата от 50% составляет не более 1% в любую сторону, т.е. находится в диапазоне 490–510? Такое испытание называется схемой Бернулли, и ответ на поставленный вопрос дается теоремой Лапласа, из которой нас интересует только итоговая формула, а именно, следующий вывод:
при проведенииNнезависимых испытаний с вероятностью выпадения двух возможных вариантов p и q, причем p+q=1, вероятность того, что число появлений выбранного варианта находится между k_1и k_2, вычисляется по формуле:

P_N(k_1, k_2)=\Phi(\frac{k_2-Np}{\sqrt{Npq}})-\Phi(\frac{k_1-Np}{\sqrt{Npq}})\quad\quad(1)

где\Phi— функция Лапласа,

\Phi(x)=\frac{1}{\sqrt{2 \pi}}\int_0^xe^{-t^2/2}dt

Для наших целей полагаем p=q=0,5 и

k_{1,2}= N*(0,5 \pm\Delta)

где \Delta — то отклонение от истинного значения, которое мы исследуем. При этом формула (1) принимает достаточно простой вид:

P_N(\Delta) = 2\Phi(2\Delta\sqrt{N})\quad\quad(2)

Вернемся к задаче, поставленной в начале параграфа. Положим \Delta=0,01 иN=1000. По таблицам для функции Лапласа \Phi(0,63)=0,235, и, следовательно, вероятность отклонения не больше 1% при 1000 бросаний монеты будет равна 47%. Наверное, для экспериментов с монетой нормально, но для электоральных прогнозов не очень.

Я небольшой специалист в социологии, но мне кажется достаточно естественным рассчитывать на вероятность правдоподобия опросов в районе 95%. Если при опросе 1000 респондентов мы рассчитываем на такую вероятность правильной оценки, то по формуле (2) имеем:

\Phi(2\Delta\sqrt{1000}) = 0,475

По таблице находим аргумент под функцией\Phi— 1,96. и после простейших арифметических операций, получаем\Delta=3\%, что на нормальном русском языке означает следующее:

При опросе 1000 респондентов с вероятностью 95% отклонение от среднего значения не будет превышать 3%, т.е. результыты опроса будут в диапазоне 470–530.

В точности это мы и видим на первой строчке опросов по штату Мичиган ра рис. 1. Для большей корректности, посмотрим, как на эти цифры влияет небольшая асимметрия монеты или предпочтений респондентов. Предположим, что истинное значение вероятности одного из исходов — 45%, и нам нужно, чтобы при 1000 испытаний результат находился в диапазоне 420–480, т.е. ошибка опять-таки не превышала 3% от общего количества испытаний. По формуле (1) нетрудно получить результат вероятности в 94,3%, что, конечно хуже, чем 95%, но ненамного. Тем не менее, будем это имет в виду.

В любом случае, если посмотреть на реальные результаты опросов, то возникает закономерный вопрос — насколько можно доверять процентам каждого из двух кандидатов в данном опросе, где, скажем, у Джозефа Байдена 44%, а у Дональда Трампа 46%, т.е. разница между ними меньше «погрешности измерений»? Наверное, все-таки можно, но, как говорится, осторожно, имея в виду вышеизложенное.

Если поставить целью снизить ошибку до 1% с той же вероятностью в 95%, то по аналогичной процедуре легко получить, что число респондентов должно быть около 10000. Глядя на Рис 2 с результатами национальных опросов, мы видим, что Morning Consult претендует на точность оценки предпочтений избирателей в 1% при опросе 6300 человек.

Рис 2. Результаты общенациональных опросов. Источник - https://www.270towin.com

Рис 2. Результаты общенациональных опросов. Источник — https://www.270towin.com

Если посчитать вероятность правдоподобия этого результата, то мы получим только 89%, т.е. фирма немного лукавит. Оставим это на их совести.

Ну, а теперь более интересное. Какова ситуация по штатам на конец февраля?

Как мы обсуждали в предыдущей публикации, все штаты США (плос округ Колумбия) делятся на три группы — условно демократические, в которых перевес демократов над республиканцами по опросам превышает 5%, условно республиканские, где ситуация обратная — республиканцы на 5% или более впереди, и остальные — «колеблющиеся» штаты, с небольшой разницей в рейтингах претендентов. По ситуации на конец февраля к группе демократических, или «голубых», можно отнести 18 штатов с общим количеством 212 голосов выборщиков. К группе республиканских, «красных» штатов» отнесем 27 штатов с количеством голосов выборщиков 257.

Теперь подробнее о том, что осталось.

Один штат — Мэн (Maine, 4 голоса выборщиков) — заслуживает отдельного рассмотрения. Это один из двух штатов, в которых голоса выборщиков могут поделиться между кандидатами (второй такой штат — Небраска, Nebraska, 5 выборщиков). На сегодняшний день в среднем по штату Мэн лидирует Дональд Трамп с 48% голосов против 42% у Джозефа Байдена, что дает республиканцам два голоса выборщиков из четырех по штату в целом. В двух избирательных округах, каждый из которых располагает одним выборщиком, предпочтения избирателей противоположны — в округе 1 лидируют демократы (39% на 31%), а в округе 2 — республиканцы (45% на 25%). Таким образом, голоса в штате Мэн делятся 3 к 1 в пользу Трампа, т.е. ситуация 2020 года отражается зеркально, тогда Трамп получил в этом штате только один голос в округе 2. Таким образом, с учетом этого штата у демократов получается 213 голосов выборщиков, а у демократов — 260.
Ситуация для демократов за месяц не улучшилась еще и потому, что штат Невада (Nevada, 6 голосов выборщиков), который в январе находился в «серой» зоне с раскладом голосов 47% на 45% в пользу республиканцев, теперь сильно сдвинулся в «красную» зону, у Трампа остались те же 47%, а рейтинг Байдена снизился до 40%. Нельзя, правда, не отметить дрейф штата Колорадо (Colorado, 10 голосов выборщиков) в обратном направлении — из «серой» зоны в «голубую», теперь в этом штате преимущество демократов составляет 7%.

У нас остается всего пять «колеблющихся» штатов, причем только один склоняется в пользу демократов — Миннесота (Minnesota, 10 выборщиков от штата) с раскладом голосов, как и месяц назад, 42% на 39%. В остальных четырех лидируют республиканцы, а именно:


Аризона (Arizona, 11 выборщиков) — 43,5% у демократов и 46,5% у республиканцев. В конце января разница была больше, около 6%. Позже мы еще вернемся к этому штату.

Мичиган (Michigan, 15 выборщиков) — 43% у демократов, 46,3% у республиканцев. Разница немного подросла, месяц назад она составляла 2%.

Пенсильвания (Pennsylvania, 19 выборщиков) — 43,7% у Байдена, 45% у Трампа. По раскладу на конец января в этом штате было примерно такое же преимущество, но у демократов.

Висконсин (Wisconsin, 10 выборщиков) — 45,5% у Байдена, 47,7% у Трампа. Разница чуть уменьшилась, месяц назад она составляла 4%.

Если на цифры смотреть скучно, результаты представлены на Рис 3.

Рис 3. Сравнение рейтингов кандидатов январь-февраль 2024.

Рис 3. Сравнение рейтингов кандидатов январь-февраль 2024.

Таким образом, для победы республиканцам достаточно опередить демократов только в одном из этих четырех штатов, а демократом для этого необходимо «забирать» все пять.

Серая лошадка — независимый кандидат.

Ситуацию для демократов может еще «подпортить» независимый кандидат Роберт Кеннеди младший (Robert F. Kennedy Jr.)— племянник знаменитого президента Джона Кеннеди (John F. Kennedy). Пока его победа в каком-либо из штатов выглядит маловероятной. Такая гипотетическая возможность видна, пожалуй, только в штате Аризона, где по одному из опросов (правда, довольно старому, от начала ноября) New York Times дала ему рейтинг целых 26% против 33% у Байдена и Трампа. Однако Кеннеди может, отобрав голоса у Байдена, сместить результаты голосования в каком-нибудь штате в пользу Трампа. Таким штатом, например, является Нью-Хэмпшир. По опросам в паре Байден-Трамп этот штат вполне себе «голубой», у Байдена 52% голосов против 45% голосов у Трампа. Однако при опросах с участием независимого кандидата, ситуация сдвигается в пользу Трампа с процентами кандидатов Байден-Трамп-Кеннеди по 44%-41%-12%, т.е. Нью-Хэмпшир фактически попадает в группу «колеблющихся» штатов. Это штат располагает всего четырьмя голосами выборщиков, но ситуация тем не менее, тревожная.

Кроме того, участие Кеннеди в некоторых колеблющихся штатах (например в Мичигане и Висконсине) повышает шансы Трампа на победу, увеличивая его преимущество над Байденом. Сравнение рейтингов кандидатов в этих трех штатах с участием Кеннеди и без него, представлено на Рис 4.

Рис 4. Рейтинги основных кандидатов приучастии Роберта кеннеди младшего

Рис 4. Рейтинги основных кандидатов приучастии Роберта кеннеди младшего

За выборной кампанией Роберта Кеннеди довольно интересно наблюдать. Например, для того, чтобы облегчить ему попадание в избирательные бюллетени, в некоторых штатах его сторонники зарегистрировали новую партию, и Кеннеди уже пойдет не как независимый, а как кандидат от партии. Во что это выльется дальше, посмотрим. Возможно, придется подождать до выборов в 2028 году. Очень важно, что основная группа поддержки Кеннеди располагается в возрастной группе от 18 до 34 лет. В ней он, набирая 38% голосов респондентов, опережает и Бадена (32%) и Трампа (27%).

Немного светских новостей

Если Вы интересуетесь темой выборов президента США, то невозможно обойтись без обсуждения всего того, что их окружает, хотя бы в формате короткого обзора.

Многочисленные уголовные и административные дела против Дональда Трампа продолжаются. Огромные штрафы, конечно портят претенденту настроение, но реально повлиять на его учатие в выборах может только дело о «восстании» 6 января 2021 года со штурмом Капитолия. Судя по всему, дело будет тянуться очень долго, и до даты выборов не закончится. Сопутствующие проблемы, типа дела о возможном отстранении от выборов в Колорада, которое сейчас находится в Верховном Суде США, могут быть вообще решены в пользу ответчика.
Самая громкая тема вокруг кампании на переизбрание Джозефа Байдена — конечно, его здоровье действующего президента. Интерес к теме резко возрос после доклада специального прокурора Роберта Хура (Robert Hur), котрый после непродолжительной беседы с президентом на достаточно никчемную тему обнаружил, что у того есть проблемы с памятью. И это бы еще ничего. Похоже, бОльшую роль в «раздувании» темы здоровья Байдена сыграл его отказ (второй раз, как и в прошлом году) от символического интервью перед Super Bowl — финальным матчем по американскому футболу, трансляцию которого в Америке посмотрели более 200 миллионов человек.

В общем, несмотря на то, что кандидатуры на президентские выборы от основных партий фактически уже определены, вокруг много событий. Проходящие сейчас праймериз, похоже, уже ничего не изменят, но и там без скандалов не обходится.

Если Вам интересна тема выборов в США, и Вы хотели бы следить за новостями более детально и в реальном времени, заходите на телеграм-канал автора. Если Вы хотите поучаствовать к голосовании на тему — Продолжать или нет публикации на тему выборов президента США?  — сделайте свой выбор в конце предшествующей статьи.

С удовольствием отвечу на вопросы и комментарии.

© Habrahabr.ru