Обновить

Прогноз ЧМ 2014 на языке Вольфрама

Поисковые технологииData Mining


На ЧМ по футболу закончилась групповая стадия, количество команд-участниц сократилось вдвое, стали известны пары участников плей-офф. В связи с этим, разработчики из компании Wolfram Research обновили расчёт статистической вероятности для оставшихся матчей.

Предварительно в Wolfram|Alpha загрузили около 200 МБ данных, извлечённых со специализированных сайтов. Это, прежде всего, исторические данные о 30 000 международных матчах с 1950 по 2014 годы, в том числе составы команд и характеристики игроков. Это не только для прогноза исхода матчей, а чтобы система Wolfram|Alpha могла обрабатывать поисковые запросы, связанные с футболом.

Например, вот статистика по изменению роста и индекса массы тела футболистов за последние 50 лет.





Возвращаясь к анализу ЧМ 2014, модель рассчитывает вероятность исхода каждого матча, основываясь на статистике прошлых игр, в том числе с учётом преимущества домашнего поля, преимущества своего континента и других факторов, которые выявились после анализа исторической базы. Модель затем прошла тренировку на 2000 последних матчах и показала точность прогноза 48%.



После добавления в модель Elo-рейтингов команд точность увеличилась 58,3%, а для матчей на выбывание — 75,7%. Это вполне достаточно, чтобы рассчитать вероятность исхода ЧМ 2014.

Итак, после групповой стадии вероятность победы в турнире распределяется следующим образом.



По сравнению с предыдущим прогнозом, резко выросли шансы Нидерландов (благодаря крупной победе над фаворитом).

Наиболее вероятная пара финалистов — Бразилия и Нидерланды.



Вся сетка предполагаемых исходов игр плей-офф показана на схеме.



Ещё один набор диаграмм показывает вероятность выигрыша (синим) или проигрыша (оранжевым) для 9 наиболее рейтинговых команд на каждой стадии плей-офф.



На групповой стадии ЧМ 2014 точность прогноза Wolfram|Alpha составила 62,5% (движок правильно рассчитал победу Коста-Рики над Италией, ничью в матче Германии и Ганы, ничью Бразилии и Мексики, а также несколько других неочевидных исходов). Посмотрим, как модель покажет себя в матчах плей-офф.
Теги:FIFA World Cupчемпионат мирафутболWolfram Alpha
Хабы: Поисковые технологии Data Mining
Рейтинг +38
Количество просмотров 32,6k Добавить в закладки 95
Комментарии
Комментарии 49

Похожие публикации

Data Scientist
9 марта 2021126 000 ₽Нетология
Факультет аналитики Big Data
15 марта 2021270 000 ₽GeekBrains
Data Engineer 8.0
10 марта 202177 000 ₽New Professions Lab
Специалист по Data Science
18 марта 2021104 000 ₽Яндекс.Практикум
Data Science Bootcamp
29 марта 2021250 000 ₽Elbrus Coding Bootcamp

Лучшие публикации за сутки