Эло, действительно, далеко не универсальная модель (в киберспорте, к примеру, чаще применяется Глико и её модификации).

глико в принципе выглядит как лучшая замена в местах, где используется Эло, т.к. расширяет ее модель учетом инфляции, волатильности и доверительным интервалом.

Ну хоть где-то Рони первый!..

Меня больше удивили четвёртое место Селби и уверенное присутствие Джека Лисовски в топ-16.

А меня больше удивило что Брессель обходит Магуйара в официальной таблице
Ронни «Ракета» для меня все равно номер один. Без таблиц и рейтингов. Его игра завораживает.
Приведу пример прогнозов модели ЭлоБета. Вероятность того, что игрок №16 (Yan Bingtao) выиграет один фрейм у игрока №1 (Ronnie O'Sullivan) равна 0.404. В матче до 4 побед она падает до 0.299, в «до 10 побед» — 0.197 и в финале Чемпионата Мира до 18 побед — 0.125. По моему мнению, эти значения достаточно близки к реальности.
Не могу понять. С увеличением общего количества феймов вероятность выигрыша хоть одного фрейма слабым игроком должна увеличиваться. Проще выиграть один из 18, чем 1 из 4. В чем подвох?

Не совсем корректно написал. Имелось в виду "выиграет матч до одной победы… равна 0.404".

При расчёте вероятности победы вы суммируете вероятности всех возможных исходов. То есть, для игры до 4 побед вы суммируете вероятности исходов 4:0, 4:1, 4:2, 4:3. Но в действительности вам известно конкретное количество фреймов, выигранное каждым соперником. И вероятность победы 4:0 сильно отличается от вероятности победы 4:3 и тем более от вероятности победы с любым счётом.


Проще всего рассматривать каждый фрейм как отдельный матч для обычного рейтинга Эло, не накручивая поверх не совсем подходящее сюда распределение. Требуется только одна поправка — не обновлять рейтинги после каждого фрейма, а суммировать дельты на протяжении матча и обновлять рейтинги однократно по его завершении. Это необходимо для того, чтобы порядок взятия фреймов, который нам не известен, не влиял на результат.


Это всё, конечно, в предположении независимости исходов каждого фрейма. На что вы и сами опирались в рассуждениях.

Спасибо за интерес к теме.
Рассматривал такой вариант. Мне в нём не понравилось две вещи:
  1. На данный момент у игроков не стоит задача выиграть матч с как можно большей разностью фреймов. Поэтому считать её показателем разности силы не очень корректно.
    В снукере цель «всего лишь» выиграть матч, т.е. выиграть определённое количество фреймов раньше соперника.

    Именно после формулирования этой фразы в голову пришла мысль считать вероятность конкретно такого исхода.
  2. Даже если у игроков будет стоять задача выигрывать с максимальной разностью фреймов, остаётся проблема с учётом различной длительности матчей. При таком последовательном вычислении суммарной дельты прирост у победителя в матче со счётом 18:17 будет меньше, чем при 4:0 (аж в четыре раза). Или, например, прирост будет одинаков в матчах 18:14 и 4:0. Такое свойство, как мне кажется, не справедливо отражает прирост «силы» игроков.
    Можно попробовать брать какую-то хитрую зависимость от разности фреймов и длительности матчей, но из-за предыдущего пункта я прекратил поиски в этом направлении.

Эти аргументы противоречат предположению о независимости исходов каждого фрейма. И тогда использованная вами оценка вероятности победы тоже не работает, потому что суммирует вероятности исходов встреч, когда игроки борются в каждом фрейме без оглядки на общий результат.


Если исходы фреймов независимы, то точнее будет подход, который я предложил. Если же игроки думают только о результате в целом, подстраивая силу игры в зависимости от текущего счёта, то обычный Эло будет точнее вашего подхода.

Довод насчёт предположения о независимости, в принципе, похож на правду. Тем не менее, длительность матча при обычном и агрегирующем Эло в расчёт не берётся, что достаточно плохо.

Что Вы имеет в виду под «будет точнее»?

Имею в виду ровно то, о чём писал выше.


Если исходы фреймов независимы, то оценка вероятности победы с конкретным известным нам счётом точнее, чем её приближение по вашему методу, которое не использует всей полноты информации.


Если игроки воспринимают матч как единое целое и способны максимально гибко подстраивать силу своей игры под обстоятельства, то ваш расчёт не имеет смысла, так как строится на предположении, что все варианты развития матча равновозможны.

По поводу не использования полноты информации. Я исхожу из предположения, что перед игроками стоит задача выиграть матч до n побед. Модель обычного Эло на бинарных (победа/поражение) результатах матча не учитывает параметр n (недоиспользует информацию). Ваш подход неявно пытается это делать, но исходит из предположения, что конкретный счёт имеет значение в оценке силы игроков (переиспользование информации, по моему мнению). При текущем формате проведения соревнований в снукере мне это видится не разумным, т.к. единицей учёта достижений является факт победы в матче, а не его счёт. И проблема состоит как раз в том, чтобы учитывать «весомость» каждого матча, а не «весомость» счёта в каждом матче.

Ни в коем случае не предполагается, что все варианты развития матча равновозможны. У каждого из них есть своя вероятность. Другое дело, что конкретный счёт не учитывается в выводе по причинам из предыдущего абзаца. Использование такой модели всё равно полезно, т.к. позволяет учитывать длительность матча. Независимость исходов отдельных фреймов является приближением к реальности, грубость которого оценивается полезностью итоговой модели.

Кстати, дополнительно поразмыслив над предложенным Вами способом, осознал, что я его недопонял. Почему-то думал, что агрегируются бинарные результаты фреймов и итоговая дельта есть <разность фреймов> * K * (1 — <вероятность победы в одном фрейме>) для победителя. При таком подходе дельта в матчах 4:0 и 18:14 действительно будет одинаковой. Если же явно суммировать дельты исходов отдельных фреймов, то результат может привести к загадочным последствиям. Например, сильный игрок выиграл матч у слабого, но отдал достаточно много фреймов. В результате рейтинг понижается, хотя цель (выиграть в матче) была достигнута.
Только полноправные пользователи могут оставлять комментарии.
Войдите, пожалуйста.