Искусственный интеллект предсказал результаты чемпионата мира по футболу 2018

Совсем скоро в России начнется чемпионат мира по футболу 2018 года. Многие будут следить за этим событием, включая букмекеров, которые уже постарались предсказать итоги чемпионата. Вместе с ними эти итоги попытались предсказать и ученые. В этом им помог искусственный интеллект и совмещение известных подходов по прогнозированию исхода спортивных событий. Была написана объемная работа.


Работу проделали Андреас Гролл из Университета Дортмунда, Кристоф Лей и Ханс Ван Эсетвед из Университета Гента, а также Гюнтер Шаубергер из Мюнхенского Технического Университета. Они проанализировали подходы, которые используют букмекеры для определения коэффициентов.

Как букмекеры работают с прогнозами
Для этого одни букмекеры моделируют матчи всех команд. На основе этих данных можно сказать, что Бразилия победит в финале чемпионата мира по футболу 2018 года с вероятностью 16,6 процента, Германия – 15,8 процента, а Испания – 12,5 процента.

Другие букмекеры используют статистическую модель, основанную на четырех факторах: рейтинг Elo, результаты квалификационных матчей, успехи в предыдущих чемпионатах мира и домашнее преимущество. На основе этих данных букмекеры отдают 24 процента на победу Германии, 19,8 процента Бразилии и 16,1 процента Испании.

 


Другой метод прогнозирования, который неплохо себя зарекомендовал, использует модель регрессии Пуассона. Таким образом моделируется количество голов, которые может забить команда в каждом матче чемпионата.

Как делают прогнозы ученые
Ученые должны были объединить преимущества всех методов прогнозирования и создать свой, улучшенный способ. Начали они со сбора данных о предыдущих чемпионатах мира по футболу, которые проходили с 2002 по 2014 год. При сборе информации внимание уделялось следующим факторам:

Экономические факторы (популяция и ВВП на душу населения);
Спортивные факторы (вероятность победы от букмекера, рейтинг FIFA);
Домашний фактор (находилась ли команда в своей стране, на своем континенте или в своей конфедерации);
Командные факторы (средний возраст игроков, количество товарищей по клубу, количество игроков Лиги чемпионов, количество легионеров);
Тренерские факторы (возраст, национальность и продолжительность карьеры).
В общей сложности получилось 16 переменных. Теперь команде ученых было необходимо использовать различные методы для прогнозирования.

Random forests – алгоритм машинного обучения;
Регрессия – метод, в котором десятки команд рассматривались как независимые переменные;
Ранжирование с помощью модели Пуассона для определения текущих способностей команд.
Все три метода были скомбинированы для формирования финального предсказания.

Прогноз на чемпионат мира по футболу 2018 года
В формировании этого предсказания учитывались данные с 7000 матчей 228 сборных команд. Комбинирование методов прогнозирования позволило предсказать результат каждого матча чемпионата и получить вероятность победы для каждой команды. Забегая вперед, скажем, что с вероятностью 17,8 процента кубок получит сборная Испании. Вероятность высока, но снижается соответственно для сборных Германии, Бразилии, Франции и Бельгии. Ниже приведена таблица вероятностей для каждой из команд.

 

Как вы можете видеть, вероятность того, что сборная России станет чемпионом мира по футболу в этом году, составляет 0,1 процента. С вероятность в 50,4 процента наша национальная сборная выйдет из группы, но четвертьфинальную игру пройти, скорее всего, не удастся.

Интересно выделить то, что шансы Испании и Германии на победу в турнире практически равны, но у Испании больше шансов дойти до финала. Согласно прогнозу, Испания выйдет из группы на матч с Уругваем, Россией, Саудовской Аравией или Египтом, в то время как Германии встретится более сильный соперник (Бразилия, Швейцария, Сербия или Коста-Рика).

Был сделан прогноз и для группового этапа. Его вы можете видеть ниже.

А вот и самый вероятный сценарий развития событий на чемпионате мира по футболу 2018 года.

Для получения этих данных использовались все преимущества различных подходов к прогнозированию и было проведено 100 тысяч симуляций турнира. Но мы все равно будем болеть за любимые сборные.

Назад