ПРОЕКТ НОВОЙ РОССИЙСКОЙ РЕЙТИНГ-СИСТЕМЫ

    ОБОЗНАЧЕНИЯ:
  • РК - рейтинг-коэффициент, числовая (вероятностная) оценка текущего уровня игры;
  • РКо - начальный рейтинг-коэффициент (перед пересчетом);
  • РКкон - конечный рейтинг-коэффициент (после пересчета);
  • РКср - средний рейтинг-коэффициент соперников (только из рейтинг-системы);
  • КC - коэффициент стабильности рейтинга (определяется степенью достоверности рейтинг-коэффициента);
  • КСо - коэффициент стабильности рассматриваемого игрока перед пересчетом (с учетом возможного снижения из-за неучастия);
  • КСi - коэффициент стабильности i-го соперника перед пересчетом (с учетом возможного снижения из-за неучастия и аномальности);
  • КСкон - коэффициент стабильности рассматриваемого игрока после пересчета;
  • Квр - коэффициент снижения КC при длительном неучастии в турнирах;
  • Кан - коэффициент аномальности (мера превышения отклонения результата игрока от прогнозируемого выше средннего квадратического отклонения);
  • N - число рейтинг-партий, по которым производится пересчет рейтинга;
  • Nпоб - число побед из N рейтинг-партий;
  • Nож - ожидаемый результат (вероятностный прогноз: математическое ожидание количества набранных очков);
  • S - среднее квадратическое отклонение, равное квадратному корню из произведения числа партий на вероятности выигрыша и проигрыша в партии со "средним" соперником;
  • SUM () - сумма величин, стоящих в скобках;
  • р(DРК) - функция вероятности выигрыша в партии более сильного игрока при разнице в рейтинге, равной DРК.


ВВЕДЕНИЕ

Данный проект был разработан на основе проведенного анализа опыта применения рейтинг-системы, предложенной в 1990 году, а также с учетом анализа рейтинг-систем, используемых в ЕГФ и на международных игровых серверах. Напомним базисные принципы практических рейтинг-систем:

1. Каждый игрок, входящий в рейтинг-систему (РС), получает рейтинг-коэффициент (РК), соответствующий уровню игры (мастерства). Текущая оценка (рейтинг) уровня игры имеет определенную точность (доверительный интервал, например [-25,+25] очков) и достоверность (например 90%). При заданном доверительном интервале достоверность рейтинга отдельных игроков характеризуется коэффициентом стабильности КC, который равен 1, если достоверность соответствует выбранному в РС уровню (т.е. доверительная вероятность не менее заданного уровня, например 90%).

2. При регулярном участии в турнирах, учитываемых как рейтинговые, и при незначительных колебаниях рейтинга (низкая дисперсия) достоверность рейтинга игрока приближается к 100% (т.е. становится больше, например, чем 90%) и КC остается равным 1.

3. Достоверность падает при длительном неучастии в турнирах или большой дисперсии результатов игрока (нестабильная игра).

4. Влияние игрока на рейтинг других игроков находится в прямой зависимости от достоверности его рейтинга (чем ниже достоверность, тем меньше влияние на рейтинг других).

5. При резком увеличении рейтинга и достаточной достоверности прогноза дальнейшего его роста производится специальная корректировка рейтинга для обеспечения динамичного отслеживания реального изменения силы игры и уменьшения отрицательного влияния несоответствия рейтинга растущего игрока его уровню игры (корректировка аномального роста).

6. Для привязки всей системы, обеспечения меньшего смещения общего рейтинга, регулярно делаются поправки, рассчитываемые по изменению рейтинга наиболее стабильных игроков (анкеров) из сильнейшей группы.

7. Рейтинг-система должна быть согласована с традиционной квалификационной системой кю-данов.

Вышеизложенные принципы положены в основу большинства используемых рейтинг-систем, например на международных игровых интернет-серверах WING, NNGS и других.


ВХОЖДЕНИЕ В РЕЙТИНГ-СИСТЕМУ

Каждому игроку, входящему в рейтинг-систему, должен быть присвоен рейтинг-коэффициент (РК) с коэффициентом стабильности (КC) выше нуля. Не входящие в РС игроки выступают в турнирах с условным рейтингом, назначаемым проводящей организацией с учетом пожеланий игрока и др. факторов. Такие игроки не влияют на рейтинг игроков из РС.

Если игрок, выступающий в турнире с условным рейтингом, не возражает против включения его в РС, то по результатам турнира ему может быть присвоен РК и вычислен начальный коэффициент стабильности КC. Для этого необходимо, чтобы данный игрок одержал в турнире хотя бы одну победу над игроком из РС. Тогда его начальный РК в РС вычисляется следующим образом.

Находим средний РК соперников (только из РС) -- РКср. Если квалифицируемый игрок имеет абсолютный результат (100% побед), то вычисляем вероятность выигрыша Р в партии с усредненным игроком с рейтингом РКср из условия, что 100%-й результат в теоретико-вероятностной схеме Бернулли при N партиях имеет вероятность 50%. Это условие есть Р^N = 0.5 (Р в N-ой степени), откуда находим Р как корень N-ой степени из 0.5. В противном случае определяем Р как отношение набранных очков к числу партий (снова только с игроками из РС). По найденному значению Р вычисляем смещение рейтинга квалифицируемого игрока от РКср.

Например, при N = 1 (ровно одна партия и одна победа) берем в качестве начального РК рейтинг соперника, у которого выиграл данный игрок. При N = 5 и счете 4:1 получим в условиях применяемой сегодня в России рейтинг-системы примерно такой результат (80% побед, Р = 0.8):

РК = РКср + 200,

при счете 5:0 получим примерно (Р = 0.87 -- корень пятой степени из 0.5):

РК = РКср + 230.

Начальный КC присваивается с учетом числа сыгранных партий с игроками из РС и их среднего КCср. При N>4 задаем КC = 0.5 КСср (достоверность не более 50%), при меньшем числе -- 0.1 N КСср, но не менее 0.1.


ИЗМЕНЕНИЕ КОЭФФИЦИЕНТА СТАБИЛЬНОСТИ

Изменение КC зависит от двух факторов: срока последнего участия в турнирах и дисперсии результатов. Соответственно, пересчет КC состоит из двух этапов.

Перед пересчетом рейтинга в турнире уточняются входные значения КC всех игроков умножением на коэффициент Квр, рассчитываемый в зависимости от времени t неучастия в турнирах:

месяцев: 8 9 10 11 12 13 14 15 16
Квр 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1

При меньшем времени Квр = 1. Можно рассматривать и другие формулы для Квр (например, интерполяцию с 6 мес. до 3-х лет: Квр = 1 - (t - 6)/30). Здесь главное -- принцип расчета.

При пересчете рейтинга используется КC, получаемый умножением входного КC на коэффициент, учитывающий аномальность выступления в турнире.

Выступление игрока в турнире можно рассматривать как реализацию схемы Бернулли, если моделировать результат как серию исходов 1 или 0 с вероятностями Р и 1 - Р, где Р -- вероятность выигрыша в партии с усредненным игроком с рейтингом РКср (см. выше в разделе Вхождение в рейтинг-систему). Дисперсия в этой схеме равна D = N·Р·(1 - Р), а среднее квадратическое отклонение S = D^0.5 -- корень квадратный из дисперсии. Например, для N = 6 (типично для России) и Р = 0.5 (примерно равный состав игроков) имеем S = 1.225. Для N = 10 аналогично получаем S = 1.581. При конкретном расчете Р может быть любым, но всегда можно определить S. Будем считать результат нормальным, если |Nпоб - Nож|<S , и в этом случае расчет КС считаем завершенным.

При 2S > |Nпоб - Nож| >S определим коэффициент аномальности как

Кан = |Nпоб - Nож| /S - 1,

а при |Nпоб - Nож|>2S считаем Кан = 1. При пересчете рейтинга используется КС, получаемый умножением входного КС на 1 - Кан.

Окончательно КC вычисляется после всех пересчетов: входной КC (если он оказался перед началом турнира меньше 1) увеличивается с учетом числа сыгранных партий (по 0.1 за каждую партию, но так, чтобы КC не стал больше 1). Затем полученное значение уточняется -- умножается на 1 - Кан и округляется до десятых долей, причем КС должен быть не менее 0.1.


БАЗИСНАЯ СХЕМА ПЕРЕСЧЕТА РЕЙТИНГА

Для пересчета рейтинга используется обобщенная формула Эло:

РК = РКнач + SUM ( Ki · (Ri - Pi)).

Здесь Ri -- результат i-той партии (1 или 0), Рi -- вероятность победы в той же партии, Кi -- коэффициент динамичности для данной партии. Базисный коэффициент динамичности K берется из таблицы:

КC 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
К 40 35 30 25 20 18 16 14 12 10

Для уменьшения влияния на рейтинг игрока тех партнеров, у которых КC<1, умножаем К на КСi (КC i-го соперника, без восстановления по количеству партий, но с учетом аномальности).

Теоретико-вероятностный анализ на основе современных методов математической статистики, применяемых для проверки гипотез, показал, что конкретный вид функции вероятности р(DРК) не имеет существенного значения и ее достаточно считать линейной (анализ был проведен по просьбе автора профессором по теории вероятностей, деканом мехмата НГУ д.ф.-м.н. Саханенко А.И.). Запишем эту функцию -- вероятность победы более сильного игрока при заданной разнице рейтингов -- в таком виде:

p(DPK) = 0.5 + Кр · DРК/100

где коэффициент наклона Кр, вообще говоря, зависит от дисперсии реальной силы игры. Этот коэффициент нельзя определить из статистических данных РС, если не играются в достаточном количестве рейтинг-партии на разнообразной форе (дисперсия рейтинга в таких РС определяется преимущественно заданными коэффициентами К). Вопрос остается открытым, так как в России рейтинг-систему в настоящее время нельзя считать базирующейся на указанном выше форовом принципе.

Для ранее принятой в России РС р(100) = 66%, р(200) = 80%, что соответствует с точностью до 1% Кр = 0.15. Эти вероятности были получены по результатам статистической обработки турниров второй половины 80-х годов (тогда можно было предполагать, что система кю-данов в СССР приблизительно соответствовала форовому принципу). Ясно, что в группе 6-данов вероятность выигрыша при одном и том же DPK должна быть выше, чем в группе 1-данов. Можно предложить для верхних данов (3-6) сохранить Кр равным 0.15, для 1-3д взять меньше (например 0.12).

При большой разнице рейтингов победа более сильного должна давать хотя бы символическое очко рейтинга. С учетом привязки по анкерам это не приведет к завышению рейтинга в РС, кроме того реально наблюдается противоположная тенденция отбора рейтинга растущими игроками (их рейтинг отстает от силы игры) и происходит общий суммарный рост уровня игры (при одновременном снижении общего уровня рейтинга - это заметно, прежде всего, в группе 1-4 данов, которые наиболее часто "контактируют" с быстро растущими игроками).


КОРРЕКТИРОВКА РЕЙТИНГА ПРИ АНОМАЛЬНОМ РОСТЕ

При положительном приросте рейтинга выше среднего квадратического отклонения (аномальный прирост) кроме пересчета рейтинга по базисной схеме рассчитывается также аномальный рейтинг РКан по схеме, описанной в разделе Вхождение в рейтинг-систему. Затем находится окончательный РКкон как интерполяция между РК и РКан.

Пример

N = 9, счет 7:2; РКо = РКср = 2200; S = 1.5 (среднее квадратическое отклонение),

КСi = 1, КСо = 1;

Nож=4.5, Nпоб - Nож = SUM (Ri - Pi) = 2.5;

Кан = 0.67, КC = 0.33; при К = 10 получаем:

РК - РКо = 25, РКан - РКо = 185;

РКкон = 2332, КСкон = 0.3.


ЗАКЛЮЧИТЕЛЬНЫЕ ЗАМЕЧАНИЯ

Привязка РС к анкерам не составляет труда. Критериев выбора анкеров может быть много. Привязка имеется ввиду, прежде всего, внутренняя -- основное смещение РС вызывается отбором рейтинга растущими игроками (каждый входящий в РС систему "отсасывает" огромное количество рейтинговых очков, пока дойдет до стабильного уровня). Смещение национальных групп игроков относительно друг друга несущественно, но и оно может легко корректироваться (вообще-то нужно договариваться с Европой и др. о совместной корректировке).

Игроки, не выступающие более какого-то срока (например, 2-3-х лет) теряют рейтинг (выбывают из РС) и должны квалифицироваться снова. Этот срок должен быть согласован с Квр, т.е. должен быть не менее срока, когда Квр обращается в ноль. Для учета партий на форе тоже нет проблем.

Для статистического анализа необходимы форовые турниры. Форовые турниры нужны не только для согласования с РС, но и для статистических расчетов (например, среднее число побед на форе 1 при известной средней разнице рейтингов позволяет оценивать дисперсию силы игры, причем точнее, чем в турнирах без форы, т.к. там разница рейтингов сильнее размазана).

Предлагаемая схематическая модель рейтинг-системы рассчитана, прежде всего, на применение в группе дан-игроков. Это наиболее важно для общей стабилизации рейтинг-системы. Как и рекомендовалось еще в 1990 году, следует отделить расчет дан-уровня от остальной группы игроков. Централизовано должны рассчитываться только рейтинги игроков из верхней части рейтинг-листа. Остальные - в региональных го-организациях. Для согласования достаточно процедуры входа в основной рейтинг-лист и дисциплинированного применения единой схемы - алгоритма всеми региональными организациями. В Украине, например, это достигается распространением единой компьютерной программы пересчета рейтинга.

Все вопросы, замечания, пожелания и другие отклики просьба направлять на E-mail: Sibgo@narod.ru, в гостевую книгу или на форум сайта Sibgo.narod.ru.



© 2002-2003, C.B.Павлов, Ю.М.Беляев
Hosted by uCoz