Прогноз ЧМ 2014 на языке Вольфрама

010e0e166deba085ce697efe36ed9437.pngНа ЧМ по футболу закончилась групповая стадия, количество команд-участниц сократилось вдвое, стали известны пары участников плей-офф. В связи с этим, разработчики из компании Wolfram Research обновили расчёт статистической вероятности для оставшихся матчей.Предварительно в Wolfram|Alpha загрузили около 200 МБ данных, извлечённых со специализированных сайтов. Это, прежде всего, исторические данные о 30 000 международных матчах с 1950 по 2014 годы, в том числе составы команд и характеристики игроков. Это не только для прогноза исхода матчей, а чтобы система Wolfram|Alpha могла обрабатывать поисковые запросы, связанные с футболом.

Например, вот статистика по изменению роста и индекса массы тела футболистов за последние 50 лет.

5fc8e78cddc7af4969ff8839cb518ac1.png

0772143700818f905de2fd5754b17254.png

Возвращаясь к анализу ЧМ 2014, модель рассчитывает вероятность исхода каждого матча, основываясь на статистике прошлых игр, в том числе с учётом преимущества домашнего поля, преимущества своего континента и других факторов, которые выявились после анализа исторической базы. Модель затем прошла тренировку на 2000 последних матчах и показала точность прогноза 48%.

30c089e12c2282a39652e60b2a0e4ed3.png

После добавления в модель Elo-рейтингов команд точность увеличилась 58,3%, а для матчей на выбывание — 75,7%. Это вполне достаточно, чтобы рассчитать вероятность исхода ЧМ 2014.

Итак, после групповой стадии вероятность победы в турнире распределяется следующим образом.

da413c3590179270b21b676ba7ee5c7c.png

По сравнению с предыдущим прогнозом, резко выросли шансы Нидерландов (благодаря крупной победе над фаворитом).

Наиболее вероятная пара финалистов — Бразилия и Нидерланды.

aa7c4a5e266774887e4ec87d99b466d1.png

Вся сетка предполагаемых исходов игр плей-офф показана на схеме.

5882ebfae5ade00c12ca87e3bd466e4a.png

Ещё один набор диаграмм показывает вероятность выигрыша (синим) или проигрыша (оранжевым) для 9 наиболее рейтинговых команд на каждой стадии плей-офф.

f20b2524eec5f47cc00c66c74d525af6.png

На групповой стадии ЧМ 2014 точность прогноза Wolfram|Alpha составила 62,5% (движок правильно рассчитал победу Коста-Рики над Италией, ничью в матче Германии и Ганы, ничью Бразилии и Мексики, а также несколько других неочевидных исходов). Посмотрим, как модель покажет себя в матчах плей-офф.

© Habrahabr.ru