Как предсказывать результаты футбольных матчей?
Футбол — это гладиаторские бои наших дней, одно из немногих зрелищ, которые при всей своей грандиозности по‑прежнему остаются честными. Мы любим футбол за красивую борьбу, за торжество бойцовского духа и, конечно же, за полную непредсказуемость результата. Мы болеем за любимые команды и боготворим лучших игроков. Мы заряжаемся их бодростью и огорчаемся их усталости, мы переживаем из-за их травм и пристально следим за их личными драмами. Они для нас почти члены семьи.
Истинным любителям футбола не чужда статистика. И все же даже сухие таблицы с результатами прошлых лет они воспринимают сердцем. За строгими цифрами они видят лица игроков и тренеров, вспоминают эпические голевые моменты, проигрывают в памяти, как один футболист спорил с судьей, другой подвернул ногу, а от третьего ушла жена.
Совсем другая статистика начинается, когда за дело берутся… физики. Они не любят футбол, зато любят цифры. Статистика для них только начинается с турнирной таблицы, а затем слово берет высшая математика. Они лишены командных привязанностей и поэтому беспристрастны. А отсутствие специальных знаний о футболе только добавляет их расчетам математической объективности.
Распределение вероятностей голевой разницы в матчах за четверть сезона и полный сезон. Форма графика соответствует Пуассоновской модели. Черный: полный сезон; красный: четверть сезона.
Ученые Института физической химии Вестфальского университета имени Вильгельма (он же Университет Мюнстера, одно из крупнейших научных учреждений Германии) Андреас Ойр и Оливер Рубнер проанализировали результаты немецкой Бундеслиги за последние полвека. Результаты их работы обескураживают. Мало того, что, по мнению Ойра и Рубнера, футбол не так уж непредсказуем, как кажется. Главное, что ряд понятий, столь важных для любого болельщика, — домашнее преимущество, серия побед и поражений или, в конце концов, «пруха» — не более чем самообман или распространенный футбольный миф.
Это вам не гамбургеры лопать!
Самое интересное в работе Ойра и Рубнера — это выводы, с которыми поможет ознакомиться наша схема. И все же стоит сказать пару слов и о методах, с помощью которых физики попытались выдавить всю лирику из большого спорта. Ключевой элемент исследования — это распределение Пуассона. По большому счету, то, что футбольная статистика подчиняется Пуассоновскому принципу, — это и есть главный вывод в работе немецких ученых.
Модель Пуассона — это весьма сложная формула, характеризующая число случайных событий, произошедших за период времени, при условии, что события эти совершаются с определенной средней интенсивностью и независимо друг от друга. Модель играет основополагающую роль в теории массового обслуживания, на примере которой легко понять принцип ее действия.
Допустим, известно, что к кассиру в «Макдоналдсе» подходит три клиента в минуту. Это не значит, что в конкретно интересующую нас минуту к нему подойдет именно три человека, а не один или шесть. Модель Пуассона позволяет рассчитать точную вероятность того, что в течение минуты на кассе появится то или иное количество клиентов. С ее помощью мы можем узнать, с какой именно вероятностью придется встречать двух гостей, а с какой — четырех. Это бесценная формула для тех, кто хочет обоснованно определить необходимое количество продавцов, операторов колл-центров или консультантов.
Так вот, перед лицом статистики забить гол и купить гамбургер — это примерно одно и то же. К удивлению самих исследователей, долгосрочная статистика Бундеслиги отлично уложилась в Пуассоновское распределение. Для оценки результативности команд исследователи использовали показатель голевой разницы, то есть количество забитых голов в матче минус количество пропущенных. Они предположили, что этот показатель наиболее полно характеризует как нападение, так и защиту команды, и он лучше других вписался в Пуассоновскую модель.
Девиации и флуктуации
Соответствие долгосрочной футбольной статистики распределению Пуассона развязало ученым руки для анализа краткосрочных явлений. Если результаты команды в конкретном сезоне укладываются в Пуассоновский график, значит, ее игровая форма постоянна, а различия в счете на отдельных матчах вызваны лишь статистическими флуктуациями (попросту говоря, случайны). Если же наблюдаются отклонения от графика, значит, на результаты влияет какой-либо важный фактор. Построив графики изменения возможных факторов во времени (количество побед в серии, домашний или гостевой стадион), исследователи сопоставляли его динамику с динамикой отклонений счета. Этот корреляционный анализ позволил определить степень влияния отдельных параметров матча на результат.
Этот график демонстрирует корреляцию физической формы команды в первой половине сезона (ось абсцисс) и во второй половине сезона (ось ординат). Линия тренда демонстрирует практически линейное соответствие одного параметра второму. Другими словами, на протяжении всего сезона физическая форма команд остается постоянной. График вобрал в себя результаты игры восемнадцати команд за последние полвека.
Наиболее любопытные результаты в исследовании Ойра и Рубнера — отрицательные. К примеру, физики не верят в изменение физической формы команды в течение сезона, и там, где болельщики видят усталых игроков, они наблюдают лишь нормальную статистическую флуктуацию («фишка не легла!»). Также ученые отрицают существование «прухи», и в то время как фанаты сжимают кулачки за главных везунчиков сезона, Ойр и Рубнер предсказывают им поражение. Даже поддержка сотни тысяч болельщиков на домашнем стадионе для них — всего лишь флуктуация.
Сами ученые отмечают, что их исследование нуждается в дальнейшем углублении. Даже физику понятно, что мяч не гамбургер. Возможно, исследователи дали слишком большой простор для этих самых флуктуаций. Возможно, именно в этих самых «естественных статистических отклонениях» скрывается боевой дух игроков, тончайшие нюансы гения тренеров и флюиды фанатской поддержки. Ойр и Рубнер обещали выступить с продолжением исследования, и пока ученые колдуют над магией цифр, мы будем по старинке наслаждаться магией футбола.