ПРОБЛЕМА РЕЙТИНГА В СПОРТЕ И ВАРИАНТЫ ЕЕ РЕШЕНИЯ.
22.12.2016
Фрагмент книги Рейтинг в спорте: вчера, сегодня, завтра / А.А.Полозов. – М.:Советский спорт, 2007 – 316с.
ЧАСТЬ 3. РЕЙТИНГИ В СПОРТЕ
ГЛАВА 6. ПРОБЛЕМА РЕЙТИНГА В СПОРТЕ И ВАРИАНТЫ ЕЕ РЕШЕНИЯ.
В спорте рейтинги появились одними из первых. Причем в отличие от экономики и социологии, где традиционно особую роль играли экспертные оценки, в спорте удалось выйти на более формализованный режим. Например, в общественной жизни рейтингом политика почти всегда считали процент поданных за него голосов на выборах, научного работника — частоту цитирования его публикаций в печати и др. В спорте с самого начала соревнований по игровым видам спорта существовала простейшая система рейтинга в виде начисления очков победителю встречи. Однако и здесь есть вариации: из-за многообразия проводимых турниров к рейтингу футбольной команды могут причислить уровень ее достижений в Лиге чемпионов или число побед в клубном первенстве страны.
6.1. . ОСОБЕННОСТИ ПРОБЛЕМЫ РЕЙТИНГА В СПОРТЕ
С древних времен люди соперничали друг с другом. Это стремление быть лучше другого, опередить всех, вообще борьба за лидерство – было в крови у каждого из представителей мужской половины и отражало дух воина и охотника. Тот, кто побеждал больше врагов в битвах между племенами, считался лучшим воином, ему оказывали почести и предоставляли преимущества при дележе трофеев, лучший охотник имел право первым забирать свою долю добычи и т.д.
Позднее человек изобрел спортивные состязания, в которых воины и охотники получили возможность померяться силами не в реальной битве с врагом или схватке с диким зверем, а путем сопоставления своего умения, силы и ловкости в специальных упражнениях, служивших ранее просто для тренировок в боевом искусстве или охоте, а также в условных парных схватках или коллективных битвах.
Проблема рейтинга в спорте появилась после того, как число участников соревнований выросло и действующие формы проведения соревнований не позволяли всех их достоверно проранжировать. Появилась необходимость в интернациональных первенствах с участием десятков миллионов спортсменов или команд. Однако по круговой системе провести такое соревнование невозможно – может не хватить жизни. Таким образом, в настоящее время в системе спортивных соревнований возникла необходимость проведения глобального макротурнира, однако формула его проведения требует конкретизации. Эту проблему предстоит решать, однако из-за большой численности участников прийти к консенсусу относительно формы проведения такого макротурнира представляется проблематичным.
6.2. ПРИМЕРЫ ДЕЙСТВУЮЩИХ КЛАССИФИКАЦИЙ
ОЦЕНКА ИГРОКОВ В ХОККЕЕ
«Плюс-минус», (показатель полезности), отражает разность заброшенных и пропущенных командой шайб в то время, как тот или иной игрок находился на льду. Этот показатель не применяется к вратарям. Когда команда, играющая в меньшинстве или в равных с соперником составах, забрасывает шайбу (голы со штрафных бросков не учитываются), игроки этой команды, находящиеся в этот момент на льду, получают «плюс». .Первой командой, начавшей подсчитывать показатель «плюс-минус», были «Монреаль Канадиенс» примерно в 1950-х годах. Другие команды НХЛ переняли инициативу в начале 60-х, а сама НХЛ начала официально вычислять «плюс-минус» в 1968 году. Обычно изобретение «плюс-минуса» связывают с именем известного игрока и тренера Эмиля Фрэнсиса, однако он всего лишь популяризировал и немного адаптировал систему, придуманную в Монреале. Показатель зависит от фактора партнеры/соперники – поместите игрока в 4 звено самого «слабого» клуба кхл и в 1 звено самого сильного клуба – получите 2 разных показателя
РЕЙТИНГ МОЛОДЕЖНОЙ АССОЦИАЦИИ ИНТЕЛЛЕКТУАЛЬНЫХ ИГР («ЧТО? ГДЕ? КОГДА?», «БРЕЙН-РИНГ»)
Методика определения результатов турнира описана в регламенте. Однако в связи с большим количеством вопросов о том, что такое рейтинг и как его подсчитывают, хочу остановиться на этом моменте подробнее.
Основным критерием оценки успехов команды в турнире является количество полученных ею очков. За каждый правильный ответ команда получает 1 очко. Таким образом, количество очков — это количество правильных ответов. Часто возникают ситуации, когда к концу турнира у нескольких команд набирается одинаковое количество очков. В этом случае места в турнирной таблице распределяются по рейтингу.
Рейтинг — это вспомогательный параметр, который учитывает сложность вопросов. Существует два вида рейтинга: рейтинг вопроса и рейтинг команды. Рейтинг вопроса равен количеству команд, которые ответили на данный вопрос неправильно. Рейтинг команды равен сумме рейтингов вопросов, на которые эта команда дала правильные ответы.
Проиллюстрируем это на примере. Предположим, что в турнире принимает участие 5 команд, и было задано 10 вопросов.
Таблица 6.3. Ттурнирная таблица имеет следующий вид:
Номер вопроса 1 2 3 4 5 6 7 8 9 10 Очки Рейтинг Место
Команда 1 + + — + — — + + + + 7 13 1
Команда 2 — + + + + — — + — — 5 9 3
Команда 3 — + + — — — + — + — 4 6 5
Команда 4 + + — + — — + — + — 5 7 4
Команда 5 — + — + + + — + + — 6 11 2
Рейтинг вопроса 3 0 3 1 3 4 2 2 1 4
Знак «+» обозначает правильный ответ, знак «-» — неправильный
Как видно из приведенной таблицы, команды N2 и N4 набрали одинаковое количество очков. В этом случае не обходимо учитывать рейтинг.
На первый вопрос ответило неправильно три команды (в столбце 1 три знака «-«), потому его рейтинг рамен 3. На второй вопрос правильный ответ дали все команды, и его рейтинг равен 0. На третий — три неправильных ответа, рейтинг рамен 3. И так далее.
После этого определяем рейтинги команд. Команда 1 ответила правильно на вопросы 1, 2, 4, 7, 8, 9, 10. Следовательно, ее рейтинг равен 3+0+1+2+2+1+4=13. Вторая команда ответила правильно на вопросы 2, 3, 4, 5 и 8, и ее рейтинг равен соответственно 0+3+1+3+2=9. Аналогично для команды 3 рейтинг равен 0+3+2+1=6, для команд 4 и 5 рейтинги равны соответственно 3+0+1+2+1=7 и 0+1+3+4+2+1=11.
Таким образом, места в нашем гипотетическом турнире с учетом рейтинга распределились так, как указано в графе «Место».
Система «очки-рейтинг» разработана более 10 лет назад, успешно опробована на многих взрослых и детских турнирах во многих городах и широко используется в настоящее время. Ее удобство заключается в том, что сложность вопроса определяется, во-первых, для играющих команд, а, во-вторых, автоматически. Такой подход позволяет более адекватно расставить команды в турнирной таблице в соответствии с их игровой силой.
РЕЙТИНГ В ПАРУСНОМ СПОРТЕ
За основу предлагаемой методики взята методика O’Neill Rankings for Olympic Classes принятая ИСАФ. Спортсмен, принимая участие в регатах, получает очки, которые суммируются для подсчета собственно рейтинга. Для каждого участника суммируются его ПЯТЬ лучших результатов за предыдущий календарный год. Формула подсчета рейтинговых очков за регату P = R x F x Q x Y
Где P= Премиальные очки, R — это очки за место в регате. За первое место начисляется 100 очков, за 2 — 99 и так далее. Только первые 100 участников получают очки за участие. F — коэффициент значимости. Каждой регате присваивается некий уровень значимости для спортсменов от 1 до 5, единица присваивается регатам наивысшего уровня. Значимость регаты должна определятся некой комиссией.
Таблица 6.4. Коэффииенты
Уровень значимости Значение коэффициента F Процент участников получающих очки
1 5 Первые 80%
2 4 Первые 80%
3 3 Первые 60%
4 2 Первые 40%
5 1 Первые 20%
Очевидно, что официальные Чемпионаты страны должны иметь коэффициент значимости более высокий, чем все остальные пусть даже популярные и не менее представительные регаты. В зависимости от уровня значимости регаты определяется коэффициент F. Кроме этого значимость регаты также определяет процент участников регаты, которые получат рейтинговые очки за участие. Q — Коэффициент представительности. Каждой регате присваивается коэффициент представительности «Q». Он рассчитывается после окончания регаты, исходя из того, сколько участников регаты входили в первую тридцатку рейтинга перед началом регаты. Q определяется по формуле Q=1+n/30, где n, это число участников, которые входили в тридцатку в рейтинге к началу регаты. Q должен быть в пределах 1.0 — 1.5 . Для официальных чемпионатов страны Q всегда 1.5. Y — Годовой коэффициент. Для результатов текущего календарного года (последние 12 месяцев) годовой коэффициент Y равен 1. Таким образом подсчитываются рейтинговые очки для каждого участника для всех регат, в которых он участвовало и семь больших суммируются. Первое место в рейтинге занимает участник с наибольшим числом очков.
ФУТБОЛ: РЕЙТИНГ FIFA/COCA-COLA
Опубликованный впервые в августе 1993 ФИФА и Компанией Кока-Кола, Мировой Рейтинг от ФИФА/Кока-Кола являет собой ежемесячный статус-лист всех мировых ныне действующих старших национальных сборных. В настоящий момент ранжирование включает в себя около 180 команд (всего в ФИФА входит 203 национальные ассоциации).
При ранжировании учтены результаты всех международных матчей за последние восемь лет: матчи финалов Кубка Мира, предварительные матчи Кубков Мира, заключительные матчи континентальных первенств, предварительные матчи континентальных первенств, матчи Кубка Конфедераций ФИФА и товарищеские матчи.
Рэнкинг-лист получается в результате расчетов по компьютерной программе, которая начисляет очки команды за каждый матч, согласно ясно определенным критериям. Учтенные следующие факторы:
1. Результат (Победа, ничья и поражение)
2. Число забитых и пропущенных мячей
3. Место проведения матча (дома или в гостях)
4. Важность матча (коэффициент умножения)
5. Сила соперников
6. Региональная сила (коэффициент умножения)
Основная идея, лежащая в основе Ранжирования ФИФА/КОКА-КОЛА — та же самая что и для обычного первенства: в зависимости от результата, команда набирает некоторое число очков в каждом матче. Подсчитывается сумма набранных очков, и команды расставляются по мере убывания суммы набранных очков. Победа над слабым противником принесет меньше очков, чем победа над равным или более сильным соперником. Появляется стимул для слабой команды, которая в матче с сильной может набрать очки, даже при поражении.
Следующий учтенный фактор — число забитых и пропущенных мячей в матче. Распределение этих очков зависит от относительных сил соперников. Другими словами, гол, забитый более слабой командой будет значить больше, чем гол забитый ей более сильным соперником. С другой стороны, за пропущенные мячи очки вычитаются. Чтобы поощрять нападение, пропущенные мячи имеют меньшую стоимость, чем забитые. Для того чтобы учесть дополнительные трудности, связанные с игрой на выезде, команде-гостю предоставлена маленькую премия — 3 очка. Для игр, сыгранных на нейтральном поле или в матчах на заключительном этапе Кубок Мира никаких очков не начисляется.
Учитывается также важность игры. Матчам на Кубок Мира — придается более «тяжелый вес» чем товарищеским матч. Метод, примененный для этого,
Таблица 6.7 Коэффициенты ФИФА-Кока-Кола
Статус матча Коэффициент
Товарищеский матч 1,00
Отборочные матчи континент. первенств 1,50
Кубки ФИФА/КОНФЕДЕРАЦИЙ 1,50
Предварительные матчи на Кубок Мира 1,50
Финалы Континентальных первенств 1,75
Финалы Кубка Мира 2,00
состоит в том, чтобы использовать коэффициент, на который умножено общее количество очков данного матча. Это означает, что квалификационные матчи «весят», на 50 % выше, чем матч Узбекистан — Туркмения, континентальные финалы, соответственно, на 75 % выше и матчи в течение финалов Кубка Мира — вдвое больше.
Основанный на вышеупомянутых соображениях, общее количество очков, отданных в кредит к команде после того, как матч будет зависеть от следующих критериев:
1. Очки за результат (победа, ничья или поражение)
2. Плюс очки за мячи, забитые в матче
3. Минус очки за мячи, пропущенные в матче
4. Плюс премия для команды гостя
5. Умножение на коэффициент, учитывающий статус матча
6. Умножение на коэффициент, учитывающий региональную силу
Количество очков за победу, ничью, или поражение, также за соотношение забитых и пропущенных мячей зависит от силы противника. Чтобы, не наказать недостаток успеха слишком строго, отрицательное общее количество очков округлено до 0.00.
Некоторые фактические примеры должны помочь делать методы из ясного вычисления. В этом случае принимается, что три команды различных сил участвуют на маленьком дружественном турнире на нейтральной территории. Ради ясности не далеко премия команды, ни континентальный или факторы умножения статуса применяется.
Перед турниром эти три команды имеют следующие общие количества очков:
Команда A: — 630 очков: Команда B:- 500 очков: Команда C:- 480 очков
Таким образом, команда А — сильнейшая из трех, как бы находится на некотором расстоянии от двух других, промерено равных по силе команд В и С. Следующая таблица показывает распределение очков, для трех возможных результатах матча между самой сильной командой A, и несколько более слабой командой B:
Таблица 6.8. Практически пример
Счет 3 : 1 1 : 3 2 : 2
Команда A B A B A B
Очки за результат +17.4 +2.6 -2.6 +22.6 +7.4 +12.6
Очки за голы А +5.4 -3.6 +2.3 -1.6 +4.1 -2.7
Очки за голы B -1.8 +2.7 -4.1 +6.2 -3.1 +4.7
Все очки +21.0 +1.7 (0.00) +27.2 +8.4 +14.6
Из таблицы можно видеть, что в случае 3:1 победа, команда получает общее количество 21.0 очков. Но как более сильной команде, победа непосредственно приносит только 17.4 из них. Более слабая команда B все же зарабатывает 1.7 очка. Если бы «более слабая» команда B выиграла матч со счетом 3:1, они получила бы 27.4 очка, в то время как отрицательный результат для команды А просто «обнуляется». При ничьей (2:2), команда B, как более слабая, получает несколько больше очков, чем команда A, являющаяся более сильной командой.
Источник
Как составить рейтинг спортсменов
Все могут согласиться, что расчет своего рейтинга не так прост, как кажется на первый взгляд, но, скажу Вам по секрету, он и не так сложен.
20 октября 2010 года на сайте tt-energy.com вышла замечательная статья «Считаем рейтинг сами или зачем на соревнованиях ручка и тетрадь». Эта статья в полной мере описывает, как самостоятельно рассчитывать свой рейтинг после сыгранных турниров. Также на сайте украинского рейтинга reiting.com.ua есть общая информация о формулах, которые используются в расчете украинского рейтинга. Следуя этим инструкциям несложно рассчитать свой рейтинг. Но есть одно «Но!», кому захочется что-то считать после проведенного турнира, когда хочется лечь на кровать и задрать ноги повыше? Именно для таких спортсменов (и вообще для всех желающих) я создал простой инструмент – «Калькулятор рейтинга». Далее я расскажу, как им пользоваться.
В верхней части страницы Вам требуется вести несколько обязательных полей:
1. Ваше имя (для наглядности);
2. Ваш рейтинг и вес до начала турнира (если это первый для Вас турнир после выпуска нового рейтинга то смотрим здесь — reiting.com.ua)
Причем нужно брать именно «Рейтинг» – Р, а не «Рейтинг со штрафом», который обозначается как Рш), например У одного из игроков Р равен 79,8, но из-за маленького веса (В=1) рейтинг со штрафом Рш равен 68,8:
3. Коэффициент турнира, его можно узнать в этой таблице:
Ранг соревнования | Коэффициент |
Личный чемпионат Украины, Супер-лига, Турнир сильнейших игроков (взрослые), Кубок Украины | 1,6 |
Молодежные игры, Турнир сильнейших игроков (юниоры) | 1,4 |
Высшая лига, Региональная лига, Первенство Украины (кадеты, юноши), Юношеские игры, Турнир сильнейших игроков (кадеты), Турниры ФНТУ | 1,2 |
Остальные турниры | 1,0 |
4. Количество Ваших соперников (если меньше 10, то можете не изменять это поле; если больше 10 – введите нужное значение и нажмите кнопку «Рассчитать», которая находится в нижней части страницы, чтобы увеличить кол-во полей для Ваших соперников);
5. Данные Ваших игр:
5.1. Фамилию соперника (если Вы хотите быстро рассчитать рейтинг и убежать дальше по своим делам, то можете это поле не заполнять, но для удобства и исключения ошибок советую его заполнить);
5.2. Рейтинг Вашего соперника (может быть в далеком будущем рейтинг будет появляться сам, но пока придется вводить значение самому (см. reiting.com.ua), причем, как и со своим рейтингом, нужно указывать «Рейтинг» – Р, а не «Рейтинг со штрафом» – Рш);
5.3. Результат игры («Победа» / «Поражение», если оставить это поле нетронутым, то данная игра в расчет браться не будет);
6. И самое главное – нажмите на кнопку «Рассчитать».
Несколько тонкостей расчета рейтинга:
– Если у Вас до начала турнира не было рейтинга, то запишите Ваш рейтинг и вес равными нулю – «Калькулятор» сам рассчитает Ваш рейтинг;
– Если Вы играли с соперником, у которого нет рейтинга, но на турнире он выиграл рейтингованного игрока, то у него при расчете Вашего рейтинга будет некоторый рейтинг, который можно заранее рассчитать на «Калькуляторе». Цитата из статьи «Считаем рейтинг сами или зачем на соревнованиях ручка и тетрадь»:
Если спортсмен не имел до соревнований рейтинга и выиграл хоть у одного спортсмена, имеющего рейтинг, то для расчета берется опорный рейтинг и вес, равный 0. Опорный рейтинг равен наименьшему из рейтинга спортсменов, которым проиграны встречи но не более наибольшего из рейтинга побежденных спортсменов.
Единственное, что можно добавить – это то, что если Игрок1 (без рейтинга) выиграл у Игрока2 (тоже без рейтинга), причем Игрок1 не выиграл ни одного спортсмена с рейтингом, а Игрок2 выиграл у Игрока3 (с рейтингом), то при расчетах текущего турнира и у Игрока1, и у Игрока2 будет некоторый опорный рейтинг;
– Если после расчета Ваш рейтинг (со штрафом) оказался меньше 10 – то Вы исключаетесь из списка рейтингованных игроков. Цитата из «Правил расчета рейтинга в настольном теннисе»:
Рейтинг со штрафом ( Рш ) – используется для расстановки в начале соревнований. При весе >= 12, совпадает с рейтингом, при весе меньше 12, Рш = Р — 12 + В. Рейтинг со штрафом берется для посева игроков перед началом соревнований. Для попадания в украинский рейтинг спортсмену достаточно выиграть у одного спортсмена, имеющего рейтинг, и к концу соревнований иметь рейтинг со штрафом не меньше 10. Спортсмен исключается из системы рейтинга, при весе или при рейтинге со штрафом меньше 10.
Источник
From Wikipedia, the free encyclopedia
A sports rating system is a system that analyzes the results of sports competitions to provide ratings for each team or player. Common systems include polls of expert voters, crowdsourcing non-expert voters, betting markets, and computer systems. Ratings, or power ratings, are numerical representations of competitive strength, often directly comparable so that the game outcome between any two teams can be predicted. Rankings, or power rankings, can be directly provided (e.g., by asking people to rank teams), or can be derived by sorting each team’s ratings and assigning an ordinal rank to each team, so that the highest rated team earns the #1 rank. Rating systems provide an alternative to traditional sports standings which are based on win–loss–tie ratios.
College football players in the United States
In the United States, the biggest use of sports ratings systems is to rate NCAA college football teams in Division I FBS, choosing teams to play in the College Football Playoff. Sports ratings systems are also used to help determine the field for the NCAA men’s and women’s basketball tournaments, men’s professional golf tournaments, professional tennis tournaments, and NASCAR. They are often mentioned in discussions about the teams that could or should receive invitations to participate in certain contests, despite not earning the most direct entrance path (such as a league championship).[1]
Computer rating systems can tend toward objectivity, without specific player, team, regional, or style bias. Ken Massey writes that an advantage of computer rating systems is that they can “objectively track all” 351 college basketball teams, while human polls “have limited value”.[2] Computer ratings are verifiable and repeatable, and are comprehensive, requiring assessment of all selected criteria. By comparison, rating systems relying on human polls include inherent human subjectivity; this may or may not be an attractive property depending on system needs.
History[edit]
Sports ratings systems have been around for almost 80 years, when ratings were calculated on paper rather than by computer, as most are today. Some older computer systems still in use today include: Jeff Sagarin’s systems, the New York Times system, and the Dunkel Index, which dates back to 1929. Before the advent of the college football playoff, the Bowl Championship Series championship game participants were determined by a combination of expert polls and computer systems.
Theory[edit]
Sports ratings systems use a variety of methods for rating teams, but the most prevalent method is called a power rating. The power rating of a team is a calculation of the team’s strength relative to other teams in the same league or division. The basic idea is to maximize the amount of transitive relations in a given data set due to game outcomes. For example, if A defeats B and B defeats C, then one can safely say that A>B>C.
There are obvious problems with basing a system solely on wins and losses. For example, if C defeats A, then an intransitive relation is established (A > B > C > A) and a ranking violation will occur if this is the only data available. Scenarios such as this happen fairly regularly in sports—for example, in the 2005 NCAA Division I-A football season, Penn State beat Ohio State, Ohio State beat Michigan, and Michigan beat Penn State. To address these logical breakdowns, rating systems usually consider other criteria such as the game’s score and where the match was held (for example, to assess a home field advantage). In most cases though, each team plays a sufficient amount of other games during a given season, which lessens the overall effect of such violations.
From an academic perspective, the use of linear algebra and statistics are popular among many of the systems’ authors to determine their ratings. Some academic work is published in forums like the MIT Sloan Sports Analytics Conference, others in traditional statistics, mathematics, psychology, and computer science journals.
If sufficient “inter-divisional” league play is not accomplished, teams in an isolated division may be artificially propped up or down in the overall ratings due to a lack of correlation to other teams in the overall league. This phenomenon is evident in systems that analyze historical college football seasons, such as when the top Ivy League teams of the 1970s, like Dartmouth, were calculated by some rating systems to be comparable with accomplished powerhouse teams of that era such as Nebraska, USC, and Ohio State. This conflicts with the subjective opinion that claims that while good in their own right, they were not nearly as good as those top programs. However, this may be considered a “pro” by non-BCS teams in Division I-A college football who point out that ratings systems have proven that their top teams belong in the same strata as the BCS teams. This is evidenced by the 2004 Utah team that went undefeated in the regular season and earned a BCS bowl bid due to the bump in their overall BCS ratings via the computer ratings component. They went on to play and defeat the Big East Conference champion Pittsburgh in the 2005 Fiesta Bowl by a score of 35-7. A related example occurred during the 2006 NCAA men’s basketball tournament where George Mason were awarded an at-large tournament bid due to their regular season record and their RPI rating and rode that opportunity all the way to the Final Four.
Goals of some rating systems differ from one another. For example, systems may be crafted to provide a perfect retrodictive analysis of the games played to-date, while others are predictive and give more weight to future trends rather than past results. This results in the potential for misinterpretation of rating system results by people unfamiliar with these goals; for example, a rating system designed to give accurate point spread predictions for gamblers might be ill-suited for use in selecting teams most deserving to play in a championship game or tournament.
Rating considerations[edit]
Home advantage[edit]
France national basketball team fans
When two teams of equal quality play, the team at home tends to win more often. The size of the effect changes based on the era of play, game type, season length, sport, even number of time zones crossed. But across all conditions, “simply playing at home increases the chances of winning.”[3] A win away from home is therefore seen more favorably than a win at home, because it was more challenging. Home advantage (which, for sports played on a pitch, is almost always called “home field advantage”) is also based on the qualities of the individual stadium and crowd; the advantage in the NFL can be more than a 4-point difference from the stadium with the least advantage to the stadium with the most.[4]
Strength of schedule[edit]
Strength of schedule refers to the quality of a team’s opponents. A win against an inferior opponent is usually seen less favorably than a win against a superior opponent. Often teams in the same league, who are compared against each other for championship or playoff consideration, have not played the same opponents. Therefore, judging their relative win–loss records is complicated.
We looked beyond the record. The committee placed significant value on Oregon’s quality of wins.
— College football playoff committee chairman Jeff Long, press conference, week 12 of the 2014 season,[5] after ranking 9–1 Oregon above 9–0 Florida State
The college football playoff committee uses a limited strength-of-schedule algorithm that only considers opponents’ records and opponents’ opponents’ records[6] (much like RPI).
Points versus wins[edit]
A key dichotomy among sports rating systems lies in the representation of game outcomes. Some systems store final scores as ternary discrete events: wins, draws, and losses. Other systems record the exact final game score, then judge teams based on margin of victory. Rating teams based on margin of victory is often criticized as creating an incentive for coaches to run up the score, an “unsportsmanlike” outcome.[7]
Still other systems choose a middle ground, reducing the marginal value of additional points as the margin of victory increases. Sagarin chose to clamp the margin of victory to a predetermined amount.[8] Other approaches include the use of a decay function, such as a logarithm or placement on a cumulative distribution function.
In-game information[edit]
Beyond points or wins, some system designers choose to include more granular information about the game. Examples include time of possession of the ball, individual statistics, and lead changes. Data about weather, injuries, or “throw-away” games near season’s end may affect game outcomes but are difficult to model. “Throw-away games” are games where teams have already earned playoff slots and have secured their playoff seeding before the end of the regular season, and want to rest/protect their starting players by benching them for remaining regular season games. This usually results in unpredictable outcomes and may skew the outcome of rating systems.
Team composition[edit]
Teams often shift their composition between and within games, and players routinely get injured. Rating a team is often about rating a specific collection of players. Some systems assume parity among all members of the league, such as each team being built from an equitable pool of players via a draft or free agency system as is done in many major league sports such as the NFL, MLB, NBA, and NHL. This is certainly not the case in collegiate leagues such as Division I-A football or men’s and women’s basketball.
Cold start[edit]
At the beginning of a season, there have been no games from which to judge teams’ relative quality. Solutions to the cold start problem often include some measure of the previous season, perhaps weighted by what percent of the team is returning for the new season. ARGH Power Ratings is an example of a system that uses multiple previous years plus a percentage weight of returning players.
Rating methods[edit]
Permutation of standings[edit]
Several methods offer some permutation of traditional standings. This search for the “real” win–loss record often involves using other data, such as point differential or identity of opponents, to alter a team’s record in a way that is easily understandable. Sportswriter Gregg Easterbrook created a measure of Authentic Games, which only considers games played against opponents deemed to be of sufficiently high quality.[9] The consensus is that all wins are not created equal.
I went through the first few weeks of games and redid everyone’s records, tagging each game as either a legitimate win or loss, an ass-kicking win or loss, or an either/or game. And if anything else happened in that game with gambling repercussions – a comeback win, a blown lead, major dysfunction, whatever — I tagged that, too.
Pythagorean[edit]
Pythagorean expectation, or Pythagorean projection, calculates a percentage based on the number of points a team has scored and allowed. Typically the formula involves the number of points scored, raised to some exponent, placed in the numerator. Then the number of points the team allowed, raised to the same exponent, is placed in the denominator and added to the value in the numerator. Football Outsiders has used[11]
The resulting percentage is often compared to a team’s true winning percentage, and a team is said to have “overachieved” or “underachieved” compared to the Pythagorean expectation. For example, Bill Barnwell calculated that before week 9 of the 2014 NFL season, the Arizona Cardinals had a Pythagorean record two wins lower than their real record.[12] Bill Simmons cites Barnwell’s work before week 10 of that season and adds that “any numbers nerd is waving a “REGRESSION!!!!!” flag right now.”[13] In this example, the Arizona Cardinals’ regular season record was 8-1 going into the 10th week of the 2014 season. The Pythagorean win formula implied a winning percentage of 57.5%, based on 208 points scored and 183 points allowed. Multiplied by 9 games played, the Cardinals’ Pythagorean expectation was 5.2 wins and 3.8 losses. The team had “overachieved” at that time by 2.8 wins, derived from their actual 8 wins less the expected 5.2 wins, an increase of 0.8 overachieved wins from just a week prior.
Trading “skill points”[edit]
Originally designed by Arpad Elo as a method for ranking chess players, several people have adapted the Elo rating system for team sports such as basketball, soccer and American football. For instance, Jeff Sagarin and FiveThirtyEight publish NFL football rankings using Elo methods.[14] Elo ratings initially assign strength values to each team, and teams trade points based on the outcome of each game.
Solving equations[edit]
Researchers like Matt Mills use Markov chains to model college football games, with team strength scores as outcomes.[15] Algorithms like Google’s PageRank have also been adapted to rank football teams.[16][17]
List of sports rating systems[edit]
- Advanced NFL Stats, United States of America National Football League
- ARGH Power Ratings
- ATP rankings, international tennis
- Colley Matrix
- Dickinson System, United States of America college football
- Pomeroy College Basketball Ratings, United States of America college basketball
- Ratings Percentage Index (RPI), United States of America NCAA basketball, baseball, softball, hockey, soccer, lacrosse, and volleyball
- Smithman Qualitative Index, United States of America soccer – obsolete
- TrueSkill, a Bayesian ranking system inspired by the Glicko rating system[18]
Bowl Championship Series computer rating systems[edit]
In collegiate American football, the following people’s systems were used to choose teams to play in the national championship game.
- Anderson & Hester / Seattle Times
- Richard Billingsley
- Wes Colley / Atlanta Journal-Constitution
- Richard Dunkel
- Kenneth Massey
- Herman Matthews / Scripps Howard
- New York Times
- David Rothman
- Jeff Sagarin / USA Today
- Peter Wolfe
Further reading[edit]
Bibliographies[edit]
- Wilson, David. “Bibliography on College Football Ranking Systems”. University of Wisconsin–Madison. Retrieved 18 November 2014.
Popular press[edit]
- Feng, Ed (24 November 2014). “How to understand college football analytics – the ultimate guide”. The Power Rank.
- Mather, Victor (October 23, 2012). “College Football Rankers by the Dozen Ask the No. 1 Question”. New York Times.
- Wayne Winston is a professor of decision sciences at Indiana University and was a classmate of Jeff Sagarin at MIT.[19] He published several editions of a text on the Microsoft Excel spreadsheet software that includes material on ranking sports teams, as well as a book focused directly on this topic. He and Sagarin created rating systems together.[20]
- Winston, Wayne L. (2012). Mathletics: How Gamblers, Managers, and Sports Enthusiasts Use Mathematics in Baseball, Basketball, and Football. Princeton University Press. ISBN 978-1-4008-4207-0.
- Winston, Wayne L. (2009). Microsoft® Excel Data Analysis and Business Modeling. Microsoft Press. ISBN 978-0-7356-3714-6.
Academic work[edit]
- Barrow, Daniel; Drayer, Ian; Elliott, Peter; Gaut, Garren; Osting, Braxton (May 2013). “Ranking rankings: an empirical comparison of the predictive power of sports ranking methods”. Journal of Quantitative Analysis in Sports. 9 (2). doi:10.1515/jqas-2013-0013. ISSN 1559-0410. S2CID 199665454.
- Much of this information is available at Sports Rankings REU Final Report 2012: An Analysis of Pairwise-Comparison Based Sports Ranking Methods and a Novel Agent-Based Markovian Basketball Simulation at the Internet Archive PDF
- Gray, Kathy L.; Schwertman, Neil C. (March 2012). “Comparing Team Selection and Seeding for the 2011 NCAA men’s basketball tournament”. Journal of Quantitative Analysis in Sports. 8 (1). doi:10.1515/1559-0410.1369. ISSN 1559-0410. S2CID 121322446.
- Massey, Ken (Spring 1997). “Honors Project in Mathematics” (PDF). available at Statistical Models Applied to the Rating of Sports Teams at the Internet Archive PDF
- Mease, David (2003). “A Penalized Maximum Likelihood Approach for the Ranking of College Football Teams Independent of Victory Margins” (PDF). The American Statistician. 57 (4): 241–248. doi:10.1198/0003130032396. S2CID 2372150.
References[edit]
- ^ Fagan, Ryan (2011-03-09). “Sorting through teams on one big bubble”. Sporting News. Retrieved 2011-03-24.
This is a look at 20 of the teams (in alphabetical order) residing on this year’s big ol’ bubble. We’ve included three statistical rankings. The RPI (ratings percentage index, taken from collegeRPI.com) is considered the standard and is provided to committee members during the selection process. The two other ranking indexes include margin of victory in their formulas—the Pomeroy ratings (at kenpom.com) and Sagarin ratings (via USA Today)—aren’t new but have played an increased role in discussions about potential seeds during this college basketball season.
- ^ Ken Massey [@masseyratings] (3 Nov 2014). “@kenpomeroy human polls have limited value. Computer systems can objectively track all the teams. www.masseyratings.com/cb/compare.htm #all351” (Tweet). Retrieved 9 Nov 2014 – via Twitter.
- ^ Jamieson, Jeremy P. (2010). “The Home Field Advantage in Athletics: A Meta-Analysis” (PDF). Journal of Applied Social Psychology. 40 (7): 1819–1848. doi:10.1111/j.1559-1816.2010.00641.x. Retrieved 11 November 2014.
- ^ Barnwell, Bill (December 20, 2013). “Safe at Home”. Grantland. Retrieved November 11, 2014.
- ^ Russo, Ralph D. (11 November 2014). “Oregon up to 2 in playoff rankings; TCU to 4th”. Associated Press. Retrieved 12 November 2014.
- ^ Stewart Mandel [@slmandel] (12 Nov 2014). “Committee doesn’t use an SOS ranking. It looks at opponents’ record and opponents’ opponents record” (Tweet). Retrieved 12 Nov 2014 – via Twitter.
- ^ Richards, Darryl (2001). “BCS removes margin-of-victory element”. Fox Sports. Retrieved 12 November 2014.
- ^ Sagarin, Jeff (Fall 2014). “NCAAF Jeff Sagarin Ratings”. USA Today. Retrieved 12 November 2014.
- ^ Easterbrook, Gregg (18 November 2014). “More flags on D spins scoreboards”. ESPN. Retrieved 19 November 2014.
- ^ Simmons, Bill (24 October 2014). “Week 8 Picks: A Gambling Epiphany”. Grantland. Retrieved 19 November 2014.
- ^ Schatz, Aaron; Alamar, Ben; Barnwell, Bill; Bill Connelly; Doug Farrar (2011). Football Outsiders Almanac 2011: The Essential Guide to the 2011 NFL and College Football Seasons. CreateSpace. p. xviii. ISBN 978-1-4662-4613-3.
- ^ Barnwell, Bill (November 5, 2014). “NFL at the Half: Breaking Down the Numbers”. Grantland. Retrieved January 7, 2015.
- ^ Simmons, Bill (7 November 2014). “Revisiting the Y2K-Compliant Quarterbacks”. Retrieved 10 November 2014.
- ^ Silver, Nate (4 September 2014). “Introducing NFL Elo Ratings”. FiveThirtyEight. Retrieved 10 November 2014.
- ^ Mills, Matt (21 December 2014). “Using Continuous-Time Markov Chains to Rank College Football Teams”. The Spread. Retrieved 21 December 2014.
- ^ “Ranking NFL teams using Network Science”. LinkedIN. 17 March 2016. Retrieved 17 March 2016.
- ^ “Modifying Google’s Page Ranking Algorithm to rank teams”. Reddit. 21 December 2014. Retrieved 22 December 2014.
- ^ Weng, Ruby C.; Lin, Chih-Jen (2011). “A Bayesian Approximation Method for Online Ranking” (PDF). Journal of Machine Learning Research. 12: 267–300.
- ^ “Wayne Winston: Analytics in the World of Sports”. Indiana University Bloomington – Kelley School of Business – Operations & Decisions Technologies. Nov 25, 2013. Retrieved 8 Nov 2014.
- ^ “Numbers game”. Washington Times. April 13, 2004. Retrieved 8 Nov 2014.
У каждой истории есть своя предыстория. Проблема рейтинга существовала всегда в спорте и всегда имела какое-то решение. Если посмотреть на эти решения внимательно, то можно найти много аналогичных вариантов интерпретации спортивных результатов. Однако при общем сходстве построения шкалы рейтинга различий намного больше. Нет ни одной классификации, в которой были бы даны ответы на все поставленные вопросы. Главное, что нам следует извлечь из прошлого, — это ключевые проблемы рейтинга, принципы его работы. Дописать под выявленные принципы формулы сможет любой студент. Поэтому самой трудной частью исследования было сравнение разных подходов и выявление различий.
1.1. Предыстория вопроса
Проблема рейтинга, несомненно, является первой, с которой сталкивается любой тренер, преподаватель, специалист. Как интерпретировать полученные результаты? Как прогнозировать, исходя из них, дальнейшие успехи? На эти вопросы должен пытаться ответить любой специалист. Поэтому предпринимается очень большое количество попыток освоить данную проблему. С одной стороны, не существует более часто используемого слова, чем «рейтинг», а с другой — множество работ по этой тематике пока не привело всю совокупность мнений к единому знаменателю в виде универсальной шкалы рейтинга.
Попытки создания подобных систем предпринимались еще в 1930-х гг., но не получили распространения. Нынешняя система шахматных коэффициентов была разработана более 40 лет назад венгерским физиком Арпадом Эло, эмигрировавшим в США и ставшим одним из основателей Американской шахматной федерации в 1939 г. Теоретическая база системы изложена автором в книге «The Rating of Chess players. Past & Present* Arpad E. Elo (Batsford Ltd, London, 1978; second ed. — Arco Publishing, Inc., 1986). Именно эта работа, собственно, открыла тему рейтинга на научной основе. В ней впервые рейтинг имеет обратную связь с результатами игр. А. Эло дал оптимальное решение. В ней предполагается, что соотношение набранных (M) и потерянных (N) очков находится в степенной зависимости от разности в рейтингах соперников. Исходя из полученной разницы, по специальной таблице находят число очков, которые должен набрать данный участник в этом турнире, чтобы подтвердить свой рейтинг. Пересчет осуществляется из сопоставления ожидаемой и полученной разницы результатов, при которой за каждое избыточное или недобранное очко изменяют значение рейтинга на 10 пунктов. Для участия в квалификации, по Эло, необходимо, чтобы две трети участников турнира обладали рейтингами. Достоинства такого способа столь очевидны, а сама система столь удобна, что появилось множество работ, пытающихся улучшить предлагаемое. Недостатки системы Эло:
- Неопределенность в отношении задаваемых магических чисел.
- Средний рейтинг всех шахматистов, как и 2000 лет назад, был 2200 пунктов, как и сегодня.
- Если в результате турнира определить рейтинги участников и потом снова пересчитать результаты по этим же данным заново, то решения обычно не совпадают. Система Эло дает приблизительное решение, а не единственное.
Метод Атари-АТП используется с 1979 г. в профессиональном теннисе. Международная теннисная классификация является сугубо коммерческой. В ней нет математики. По сути дела, речь идет о внедрении системы бонуса как спортивной классификации, используемой обычно в коммерции. Изначально каждый игрок оценивается количеством набранных очков, деленным на число сыгранных им турниров. Эти очки зависят от призового фонда турнира и состава участников. Самый богатый «урожай» собирают в соревнованиях «Большого шлема». Победитель такого турнира получает 750 очков, финалист — 557, полуфиналист — 325, и так далее по нисходящей. Чемпион Кубка Кремля получает 230 очков. Кроме того, теннисист может получить и так называемые бонусы. Обыграв первую ракетку мира, он получит дополнительно 50 очков. За победу над соперниками, имеющими 2—5-й результаты, присуждают 45 очков. А вот за победу над 150—200-м игроком в классификации можно получить только очко. Всякий участник квалификационного турнира, попавший после его окончания в основную сетку, получает одно очко. За победу в классификационном турнире над каждым из первых 150 в классификации соперников ему присуждают еще одно очко. Однако сумма очков по завершении классификационного турнира не может быть больше трех. Премиальные очки в турнире-сателлите начисляются, вне зависимости от категории, только финалистам. Теннисист может играть сколько угодно, но в зачет ему пойдут результаты, показанные в 14 самых удачных для него соревнованиях за последние 52 недели. Очки сохраняются год. Поэтому, когда Е. Кафельников не играл три месяца в начале 1997 г., его рейтинг никак не ухудшился. Отметим систему рейтинга Атари-АТП как попытку «сложить» рейтинг участника по совокупности экспертно определяемых величин компенсаций различных факторов.
1.2. Как определяют понятие рейтинга в разных классификациях?
Рейтинг — индивидуальный числовой коэффициент (Эло А., 1963), (Пушков С., 2004. Преферанс).
«Индивидуальный коэффициент (ИК) шахматиста является показателем его практической силы, выраженной в числовой форме» (Шахматы (заочно). Положение*, 2003).
«Рейтинг — условный числовой коэффициент» (Садовский Л.Е., 1986).
Рейтинг — результат в тотальном макротурнире
«Рейтинг — смещенный в область целых положительных чисел результат участника всеобщего гипотетического кругового годичного макротурнира» (Полозов А.А., 1995).
Рейтинг — это сила игры, мастерство
«Рейтинг игрока настольного тенниса (далее — рейтинг) — численное выражение силы игры в настольный теннис (большее значение рейтинга означает более сильную игру в настольный теннис)» (Настольный теннис. Положение, 2003).
«Рейтинг является единой, всероссийской системой оценки мастерства спортсменов-планеристов». (Планерный спорт. Положение, 2003).
«Индивидуальный коэффициент шахматиста является показателем его практической силы, выраженной в числовой форме» (Шахматы. Положение. 2004).
«Рейтинг по ледолазанию устанавливается с целью определения порядка распределения спортсменов России по уровню их мастерства» (Ледолазание. Положение, 2001).
«Вы можете соглашаться со мной или нет, но, по моему мнению, самым большим очарованием для игроков шахматных турниров или соперников в других видах спорта является измерение их игровой силы» (Гликман М., 1998).
Рейтинг — это общественное признание
«Рейтинг — как инструмент оценки одного фигуранта относительно другого — применяется во многих отраслях и направлениях деятельности». (Бахарева Э.Л., 2003).
«Сложный показатель, отражающий прежде всего инвестиционную привлекательность банка через элементы его функциональных операций с умением приносить прибыль для своих учредителей и клиентов — вот что такое сегодняшний рейтинг банковской деятельности» (Букин С.О., 2004).
«Рейтинг… — оценка общественного признания деловой состоятельности» (Малыгин А., 2003).
Рейтинг — это усредненная оценка группы экспертов
«Рейтинг — это термин, происходящий из теории вероятностей и математической статистики. Дословно «рейтинг» (rating) означает «оценка». Что же «оценивает» рейтинг? Во многих сферах человеческой деятельности встречаются величины (признаки, параметры), имеющие предположительно численную природу, но конкретные значения этих величин, однако, не поддаются прямому физическому измерению. Многовековая практика выработала для таких величин так называемые методы экспертных оценок, когда группа лиц — «экспертов» дает заключение о характере распределения величины по некоторой, достаточно условной в большинстве случаев, шкале числовых значений. Примерами могут быть рейтинги популярности политиков, отдельных артистов и творческих коллективов, оценки успеваемости в образовании, оценки спортсменов при выступлении на соревнованиях в таких видах спорта, как художественная и спортивная гимнастика, фигурное катание на коньках, прыжки в воду, фристайл, и т.п. Применяют рейтинги и в некоторых командных видах спорта, например футбольные рейтинги европейских стран или рейтинги ФИФА» (Павлов СВ., 2004).
«Итоговый рейтинг представляет собой общую оценку политического влияния регионального лидера, в равной мере учитывающую все аспекты его влияния. При расчетах сначала определялась средняя для всех экспертов оценка влияния каждого регионального лидера по каждому из трех показателей. Затем для каждого регионального лидера был вычислен итоговый рейтинг, представляющий собой среднее арифметическое для трех указанных выше оценок влияния» (Туровский Р., 2004).
Рейтинг — это доля завоеванного информационного пространства
Рейтинг ТВ-программы — это процентное отношение аудитории данной программы к общей численности телевизионной аудитории в данный момент времени.
Рейтинг — это количество затраченного труда
«Рейтинг (в переводе с англ. — оценка, разряд, номинальное значение какого-либо параметра) представляет собой кумулятивный показатель поэтапной объективной оценки знаний студентов. Рейтинг определяет качество учебной работы студента по всем дисциплинам, считая их равноправными по значимости при подготовке специалиста в соответствии с образовательно-профессиональной программой и квалификационной».
Рейтинг — это стимул
«В основу Р-Рейтинга положен принцип: «Не фиксировать успехи или неудачи команд в прошедших соревнованиях, а стимулировать повышение класса команд в текущих соревнованиях».
В бадминтоне определяется место участника в ранг-листе «для оказания содействия организаторам соревнований при составлении таблиц, проведении жеребьевок, определении порядка номеров в командах, стимулирования спортсменов к участию в соревнованиях и повышению мастерства». (См. гл. 5).
Рейтинг — место, занимаемое спортсменом
«Рейтинг — это расположение спортсменов по ранжиру в соответствии с уровнем показанных спортивных результатов» (Красильников В.В., 1998).
«Рейтинг по ледолазанию устанавливается с целью определения порядка распределения спортсменов России по уровню их мастерства, отдельно на трудность и скорость» (Положение, 2004).
«Рейтинг игрока настольного тенниса (далее — рейтинг) — численное выражение силы игры в настольный теннис. Большее значение рейтинга означает более сильную игру в настольный теннис» (Положение, 2003).
«Рейтинг должен отражать достижения команд не за последние месяц или год, а по крайней мере за несколько лет» (Божков А.В., 2004).
Рейтинг — выявление сильнейших для сборной
«Задачей рейтинга является определение группы сильнейших спортсменов России по итогам соревнований по спортивному ориентированию бегом».
Все вместе
«Рейтинг — это и показатель спортивной формы, и инструмент самооценки, и ориентир в планах повышения спортивного мастерства. С другой стороны, для тренеров и специалистов рейтинг (не только в го, но и в других видах спорта) дает объективный критерий отбора игроков в различные сборные команды, или же кандидатов на поездку на престижные турниры. Для организаторов турниров рейтинг помогает правильно сформировать начальные группы по силе игры, проводить жеребьевку в турнирах и вообще — создать максимально равные условия выступления для всех участников, тем самым повышая качество судейства и организации турниров в целом. Ну и еще рейтинг помогает всем — и специалистам, и участникам, и зрителям — прогнозировать результаты выступления игроков в соревнованиях» (Павлов С.В., 2004).
Рейтинг — «внутренний порядок»
«Зачем нужен нам рейтинг? В первую очередь он нам нужен для установления некоторого внутреннего порядка. А порядок всегда устанавливался и поддерживался некоторой авторитарной властью. Таким образом, рейтинг — это в некотором смысле атрибут власти. Очевидно, что игрок А с рейтингом 2398 вряд ли считает, что он играет слабее игрока Б с рейтингом 2403. Но если решением власти какие-либо льготы оканчиваются на цифре 2400 и эта же власть определяет по заранее определенным правилам, что у А рейтинг 2398, а у Б — 2403, то А может только посетовать на удачу, на себя в конце концов, но должен смириться с тем, что так оно и будет. И это все при том, что все — и А, и Б, и власть — понимают, что рейтинг — это вещь довольно-таки неточная и быть абсолютно точной в принципе не может. Но рейтинг-система (РС) даже со всеми ее минусами в сочетании с, еще раз подчеркиваю, авторитарной властью обеспечивает этот порядок». (Корсак В., Го, 2004).
ПОДВЕДЕМ ИТОГИ
Определение должно сформировать главный, ключевой смысл слова «рейтинг» и тем самым предопределить направление развития темы. Определение понятия «рейтинг» однозначно должно выводить нас на информационный ориентир и поэтому не должно быть загадочным. Все приведенные определения так или иначе рейтинг характеризуют. Однако большинство из них выглядят капитуляцией перед решением проблемы. Рейтинг не должен быть мнением экспертов. Их спрашивают тогда, когда не знают, как решить проблему. Рейтинг не может быть неким неизвестным индивидуальным числовым коэффициентом. Это не решение проблемы, а бегство от нее. Рейтинг — это, разумеется, общественное признание. Но сначала надо получить рейтинг, а признание будет уже следствием. Аналогично можно сказать и о рейтинге как завоевании некоего информационного поля. Рейтинг может быть стимулом, но для этого его надо как-то определить. Рейтинг не может ни в коей мере представлять собой место, занимаемое спортсменами. Место определяют по рейтингу, но не рейтинг по месту. Рейтинг — некая помощь в подборе состава сборной? Но это ведь тоже следствие. Рейтинг — это «внутренний порядок»? Больше похоже на заклинание. Теперь нужно уточнить, что такое порядок, дать его определение. Все вышеперечисленные представления о рейтинге никак не приближают к разгадке его феномена. А без точного представления о том, что это такое, мы будем тонуть в фантазиях различных авторов. Пожалуй, более приемлемым можно считать мнение о том, что рейтинг — сила игры, мастерство. Однако это определение ничего конструктивного нам не дает. По сути верное, оно не определяет конструктивных особенностей этого самого мастерства. У кого мастерства больше: у того, кто больше забил, или у того, кто меньше пропустил? Определение рейтинга через силу игры, мастерство — это верное направление для дальнейших размышлений, но никак не итог их. Просто некий промежуточный этап.
Определение рейтинга как результата участника тотального макротурнира обобщает все вышеприведенные мнения. Это и сила игры, и признание, и состав сборной, занимаемое место и т.д. В то же время применение слова «макротурнир» дает возможность использовать имеющиеся знания на основе локальных турниров. Поле для дальнейшего творчества остается широким — макротурнир можно себе представлять по-разному. Однако поле поиска возможных вариантов ответа значительно сужается.
1.3. Изменение представлений о рейтинге. Виды классификаций
Виды классификаций:
1. Рейтинг — мнение группы экспертов. Под каждое мероприятие собираются эксперты и «взвешивают» его участников.
«…2. Подсчет индекса цитируемости. Фактически то, что приводим в списках, есть „грязный индекс”: полное количество ссылок на работы, где данный человек фигурирует в качестве автора или соавтора» (Штерн Б., 2002).
«Для каждого боксера рейтинговый коэффициент вычисляется как отношение суммы всех побед, одержанных побежденными им противниками, к сумме всех поражений тех же побежденных боксером противников» («Телебокс», 2004).
Коротко охарактеризовать такие классификации можно словами «дядя сказал». Разница только в том, что «дядей» могут быть не только нейтральные судьи, но и реальные оппоненты. Мнение группы экспертов используется там, где алгоритм решения задачи даже не просматривается. Субъективное мнение судей используется в гимнастике, фигурном катании и других видах.
2. Информационная смесь («куча-мала»-рейтинг). Вся имеющаяся информация об объекте сваливается в одну общую массу, и у кого она окажется больше, тот и будет иметь приоритет. Обычно выбор такой информации и удельных весов конкретных параметров осуществляет группа экспертов.
«Количество очков N, полученных командой за матч, рассчитывается по формуле
N = Mх Pх R+ B,
где: М — количество очков за результат матча (за победу или ничью в гостях — это число со знаком плюс, за проигрыш или ничью дома — это число со знаком минус), P— коэффициент, учитывающий, где игрался матч (дома, в гостях, на нейтральном поле), R— коэффициент, учитывающий разность мячей, B— бонусные очки, учитывающие уровень турнира и раунд (финал, полуфинал, и т.д.)» (Божков А.В., 2004).
«Формула подсчета рейтинговых очков за регату P=RхFxQх х Y, где P— премиальные очки, R— это очки за место в регате. За первое место начисляется 100 очков, за второе — 99 и так далее» (Парусный спорт. Положение, 2003).
Основная проблема таких классификаций — рейтинг не имеет физического смысла и составные ингредиенты нелинейно взаимодействуют между собой, выбрасывая наверх то одних, то других. В 1998 г. Институт истории и статистики ФРГ поставил на первое место среди футбольных клубов испанскую «Барселону», которая в тот год проиграла киевскому «Динамо» (0:3; 0:4), проиграла почти все игры в Лиге чемпионов.
3. Бонусные классификации рейтинга. За каждое занимаемое место в конкурсе начисляются очки, которые в конце года складываются. Так формируется итоговый рейтинг.
В таблице 1 приводится система начисления очков в боулинге (Украина).
Таблица 1
Система начисления очков в боулинге
Женщины | Мужчины | ||
Место | Очки | Место | Очки |
1 | 20 | 1 | 40 |
2 | 19 | 2 | 39 |
3 | 18 | 3 | 38 |
4 | 14 | 4 | 31 |
5 | 13 | 5 | 30 |
6 | 12 | 6 | 29 |
7 | 8 | 7 | 28 |
8 | 7 | 8 | 27 |
9 | 6 | 9 | 26 |
10 | 5 | 10 | 25 |
11 | 4 | 11 | 24 |
12 | 3 | 12 | 23 |
13 | 0 | 13 | 16 |
14 | 0 | 14 | 15 |
15 | 0 | 15 | 14 |
16 | 0 | 16 | 13 |
Результаты выступлений скалолазов (Скалолазание. Положение, 2004) оцениваются по таблице 2.
Таблица 2
Система оценки выступлений скалолазов
Место | Балл | Место | Балл | Место | Балл | Место | Балл | Место | Балл | Место | Балл |
1 | 100 | 6 | 47 | 11 | 31 | 16 | 20 | 21 | 10 | 26 | 5 |
2 | 80 | 7 | 43 | 12 | 28 | 17 | 18 | 22 | 9 | 27 | 4 |
3 | 65 | 8 | 40 | 13 | 26 | 18 | 16 | 23 | 8 | 28 | 3 |
4 | 55 | 9 | 37 | 14 | 24 | 19 | 14 | 24 | 7 | 29 | 2 |
5 | 51 | 10 | 34 | 15 | 22 | 20 | 12 | 25 | 6 | 30 | 1 |
Речь идет о трансформации очковой системы в бонусную. Это более дифференцированный подход. Основная его беда в том, что место должно определяться по рейтингу, а здесь наоборот — рейтинг определяется по занимаемому месту. С другой стороны, такие классификации только для узкого круга, элиты. Остальные участники вовсе остаются без рейтинга.
4. Рейтинг как итог формулы успеха. Берутся показатели успешной деятельности и обобщаются в магической формуле. Любой начинающий исследователь всегда держит в голове свой вариант такой формулы. Если вы работаете в вузе, то понимаете, что необходимо публиковаться, защищаться, выступать на конференциях. «Формулы успеха» отличаются от информационной смеси тем, что обычно создаются на математической основе как уравнение множественной регрессии из параметров, коррелирующих с общим успехом. Правда, эти формулы не имеют возможности меняться, и постепенно их эффективность падает.
В российском баскетболе ведется протокол встречи, где фиксируются следующие параметры: набранные очки (с коэффициентом 1), атакующие передачи (1), перехваты (1,4), блок-шоты (1,2), подборы на своем щите (1,2), подборы на чужом щите (1,4), фолы соперников (0,5), число неточных двухочковых бросков (—1), число неточных трехочковых бросков (—1,5), число неточных штрафных бросков (—0,8), потери при передаче (—1,4), потери технические (—1), фолы (—1). В скобках указаны коэффициенты, с которыми учитываются данные параметры в итоговом уравнении. Полученное число делят на проведенное игроком на поле время, оценивая полезность игрока КПИ за каждую минуту пребывания на поле.
«В 1997 г. были апробированы различные подходы (шесть вариантов) по начислению очков в различных возрастных группах и дистанциях. В основе этих шести вариантов лежат два направления. В первом используется формула начисления очков, как и у взрослых в элите (1), с ее корректировкой в сторону уменьшения путем умножения на коэффициент группы (2).
Оуч = 1000 × Кгр ×(2 × Тпоб / Туч — 1),
где Оуч — очки участника; Кгр — коэффициент возрастной группы, равен: К21 — 1, К18 — 0,8, К16 — 0,65, К14 — 0,55, К12 — 0,4.
Во втором направлении было предложено оценивать спортивные результаты в соответствии со скоростью прохождения дистанции (3):
Оуч = Кмест × Кдист ×Дл / Туч,
где Дл — длина дистанции, Туч — результат участника, Кдист — коэффициент дистанции, Кмест — коэффициент местности (Красильников В.В., 2000).
«Формулы успеха» могут работать только в той сфере, где долгое время ничего не меняется, поскольку они не имеют обратной связи с этими изменениями.
5. Последовательный пересчет рейтинга в направлении наибольшего равновесия рейтинга спортсмена и его результатов. Это Элоподобные классификации, в неявном виде использующие решение системы линейных уравнений. Предложение А. Эло, сделанное в 1963 г. через журнал «Chess’slife» представляет собой способ решения системы линейных уравнений методом последовательных приближений или пересчетов. Исследователи рейтинга всегда забывают, что, последовательно выписывая уравнения для участников, они используют систему линейных уравнений, которая может иметь или не иметь решений. Мой коллега, председатель комиссии по рейтингу федерации го С.В. Павлов смог усовершенствовать предложение А. Эло в сторону еще большей сходимости результатов.
«Для пересчета рейтинга используется обобщенная формула Эло:
РК = РКнач + SUM( Ki×(Ri— Pi)),
где Ri— результат i-той партии (1 или 0), Рi — вероятность победы в той же партии, К — коэффициент динамичности для данной партии» (Павлов С.В., 2003).
«Проблема системы Эло, которую исправляет система Глико, — это достоверность рейтинга игрока» (Гликман М., 1998).
Приведем в качестве примера расчета рейтинга так называемый «народный» рейтинг (Потемкин Е.Л., 2004).
«Народный — потому что для его вычисления надо знать только два действия арифметики — сложение и вычитание. Еще и зачеркивать последнюю значащую цифру у рейтинга, чтобы определить ставку на игру. На старте чемпионата все команды имеют по 100 очков. Это их стартовый рейтинг или сила. На каждую игру команды делают ставки в размере одной десятой своей силы.
8 первом туре все рейтинги равны и ставки тоже. От 100 очков рейтинга команда делает ставку в 10 очков. Победитель забирает ставку побежденного. После первого тура все выигравшие команды будут иметь по 110 очков, а все проигравшие — по 90. Во втором туре вчерашние победители ставят уже по 11 очков, а неудачники только по 9. При ничьей команды обмениваются ставками. Например, во втором туре встречаются две команды — победившая и проигравшая в предыдущем туре. Первая имеет рейтинг 110 баллов и делает ставку 11. Рейтинг второй — 90 и ставка всего 9 баллов.
Рассмотрим возможные варианты результатов во втором туре. При победе первой команды она получит ставку проигравшей (9) и ее сила будет оцениваться в 119 баллов (110 + 9). Вторая команда теряет свою ставку, и ее сила после второго поражения будет оцениваться в 81 балл (90 — 9). Если побеждает вторая команда, то рейтинги команд почти выравниваются. Первая команда теряет свою ставку, и ее сила оценивается в 99 баллов (110 — 11). Вторая команда, забирая ставку соперника, оценивается теперь в 101 балл (90 + 11). Команды после двух туров имеют одинаковое количество побед и поражений — по одному и по традиционной очковой системе оценивались бы одинаково по три очка. А народный рейтинг оценивает команду, одержавшую последнюю победу, выше — 101 против 99 у команды, проигравшей последнюю игру. Разница незначительная, но все же больше соответствующая реальной ситуации. Команда, одержавшая победу, испытывает подъем.
В случае ничьей первая команда отдает сопернику свои 11 баллов и получает взамен ставку соперника — 9 баллов. В итоге немного теряет. После ничьей рейтинг первой команды 108 баллов (110 — 11 + 9), а рейтинг второй команды — 92 балла (90 — 9+ 11). Стоит отметить, что при серии ничьих рейтинг команд выравнивается. И это тоже отражает реальную жизнь. Если команда мастеров долго будет играть с победителем районного первенства, то в конце концов их силы выравняются. Но самое главное — ничья становится невыгодной для команды, имеющей более высокий рейтинг. А это если не красный, то хотя бы и не зеленый свет на пути любителей сыграть в ничью.
Таблица 3
Пропорциональный рейтинг футбольного сезона 2003 г.
Фактически занятое место по итогам 2003 г. |
Команда | В | Н | П | М | О | «Народный рейтинг» |
4 | Локомотив | 15 | 7 | 8 | 54-33 | 52 | 170 |
1 | ЦСКА | 17 | 8 | 5 | 56-32 | 59 | 157 |
2 | Зенит | 16 | 8 | 6 | 48-32 | 56 | 153 |
3 | Рубин | 15 | 8 | 7 | 44-29 | 53 | 146 |
8 | Торпедо | 11 | 10 | 9 | 42-38 | 43 | 121 |
5 | Шинник | 12 | 11 | 7 | 43-34 | 47 | 117 |
6 | Динамо | 12 | 10 | 8 | 42-29 | 46 | 95 |
7 | Сатурн-REN | 12 | 9 | 9 | 40-37 | 45 | 87 |
10 | Спартак | 10 | 6 | 14 | 38-48 | 36 | 83 |
9 | Крылья Советов | 11 | 9 | 10 | 38-33 | 42 | 81 |
13 | Спартак-Ал. | 9 | 4 | 17 | 23-43 | 31 | 80 |
11 | Ростов | 8 | 10 | 12 | 30-42 | 34 | 74 |
14 | Торпедо-Мет. | 8 | 5 | 17 | 25-39 | 29 | 72 |
12 | Ротор | 9 | 5 | 16 | 33-44 | 32 | 67 |
15 | Уралан | 6 | 10 | 14 | 23-47 | 28 | 59 |
16 | Черноморец | 6 | 6 | 18 | 30-49 | 24 | 38 |
Посмотрим, как завершился бы чемпионат страны по футболу в соответствии с пропорциональным рейтингом в 2003 г. (см. табл. 3). По итогам сезона народный (пропорциональный) рейтинг на первую ступеньку поставил «Локомотив». Это отражает только то, что «Локомотив» играл в последних турах здорово, просто доказывая себе и своим болельщикам, что команда заслуживает большего, чем официальное четвертое место, которое определялось очками. Что же касается армейцев, то они выполнили свою задачу, и просто несправедливо требовать от них игры с полной отдачей после того, как цель достигнута» (Потемкин Е.Л., 2004).
Такого рода классификации стремятся «улучшить», «усовершенствовать формулу А. Эло. В итоге они представляют собой состоящую из заплаток «хижину дяди Тома». Все хотят ремонтировать. А кто будет строить?
6. Рейтинг — результат участника гипотетического глобального хаотичного макротурнира, который определяется через явное решение системы линейных уравнений (далее — СЛУ), где участнику компенсируют все факторы, создающие неравенство условий. Хаотичный макротурнир состоит из множества далеко не всегда взаимосвязанных микротурниров (кубок, регулярный чемпионат, международные турниры). В таких встречах часто одна из команд имеет преимущество. Например, фактор поля. Если вы выступаете в гостях, то ваши результаты объективно хуже. Корректировка таких параметров в итоговой оценке позволяет выявить реальную расстановку сил. Мой коллега, к. ф-м. н. Е.Л. Потемкин приходил к этой системе из релятивистских соображений.
Профессор Гликман, чья классификация используется в рендзю, дает нелинейное решение для макротурнира. Мы долгое время переписывались с г-ном А. Суховым, который является автором рейтинговой классификации в настольном теннисе. Он вместо СЛУ использовал теорию графов. Наши совместные исследования выявили расхождения в решениях в аналогичных ситуациях не более 3—5%. В то же время теорию графов знают от силы 10% населения, тогда как решение СЛУ знают все, кто заканчивал школу.
«Е-Рейтинг требует решения системы линейных уравнений. Отметим, что с решением такой системы нас знакомили в четвертом классе. Полная формула (Потемкин Е. Л., 2004):
Ri ×(Wi ×W + Li ×L) = Sum [Rj ×(Wji ×W + Lji ×L)]
Ai ×(Wi ×L + Li ×W) = Sum [Ai ×(Wji ×L + Lji ×L)]
Приведенные примеры представляют собой попытку свести задачу к линейной модели. Большое число вариантов составления системы линейных уравнений не привело к наполнению понятия рейтинга конкретным физическим смыслом.
7. Реальный глобальный макротурнир, результаты которого представлены в виде рейтинга. Прообразом такого глобального макротурнира является швейцарская система. В глобальном макротурнире все со всеми в круг играть не могут. Слишком много участников. Тогда нужна модель рейтинга, которая по части результатов макротурнира воспроизвела бы уровень игры (рейтинг) его участников. Из разницы этих рейтингов можно было бы получить результаты всех сыгранных и несыгранных встреч. Разница полученных рейтингов двух участников соответствует результату их личной встречи. Реальный глобальный макротурнир состоится, только если будет обеспечена сходимость предполагаемых и фактических результатов. Если из разности рейтингов следует, что вы обыграете оппонента 2:1, и вы его действительно обыгрываете с этим счетом, то возникает вопрос: зачем было играть? Сходимость позволяет не играть часть встреч макротурнира и благодаря этому сделать его реальным. Предложенная мною рейтинг-формула изложена в главе 3. Она похожа на швейцарскую систему. Однако в ней на следующем этапе между собой встречаются не просто наиболее близкие по силам участники, а происходят парные встречи всех участников двух до этого момента изолированных микротурниров. При этом в командных видах спорта можно посчитать рейтинги всех игроков.
Теперь давайте посмотрим, какие виды классификаций используются в вузе. Здесь представлено сразу несколько классификационных систем. Ученые степени присваиваются решением диссертационных советов — то есть группой экспертов.
Такая классификация отнесена нами к первому уровню. По научной работе отчитываются количеством публикаций, числом дипломников, соискателей и прочее — 2-й уровень. К этому же уровню следует отнести сегодняшний рейтинг вузов. Цитируемость можно отнести к бонусным классификациям третьего уровня, поскольку она зависит, например, от тиража журнала и т.п. Как правило, рейтинги студентов также носят бонусный характер. Выигрыш гранта вполне уместно отнести к классификации на основании формулы успеха (4-й уровень).
1.4. Основные противоречия современных классификаций
1.4.1. Что принять в качестве информационной основы рейтинга?
Соотношение времени прохождения дистанции со временем победителя
«У нас в стране по мужской и женской элите в основе подсчета рейтинга используется формула (1) (предложена тренером Му-рашко А.Н., Минск):
Оуч = 1000 × (2 × Тпоб / Туч — 1),
где Оуч — очки участника по рейтингу, Тпоб — время победителя, Туч — результат участника» (Красильников В.В. Ориентирование, 2004).
Бонусные баллы
В бадминтоне — баллы спортсмена определяются в каждом соревновании, принимаемом к зачету в рейтинг, согласно категории соревнований:
1-я категория — чемпионат России, национальный этап Кубка мира.
2-я категория — этапы Кубка России, субъектов Федерации, города Москвы.
3-я категория — все прочие соревнования, в том числе не указанные в «Календаре».
В теннисе — «количество очков N, полученных теннисистом за турнир, складывается из очков за каждый матч Mи бонусных очков Bза турнир в целом (N= M+ B). Количество бонусных очков Bопределяется уровнем турнира и количеством выигранных в турнире матчей. Количество очков M, получаемых теннисистом за отдельный матч, определяется соотношением рейтингов двух теннисистов, участвующих в матче. За победу над более сильным соперником теннисист получает больше очков, чем за победу над слабым соперником. И наоборот — за проигрыш более сильному сопернику теннисист теряет меньше очков, чем за проигрыш слабому сопернику. За победу в матче количество очков M— это число со знаком плюс, за проигрыш — это число со знаком минус (Божков А.В., 2004).
Занимаемое место
«Отклонение фактически занятого места от ожидаемого ведет к понижению или повышению рейтинга спортсмена» (Чебышев Н. Конный спорт, 2003).
Соотношение побед и поражений в парах участников (Е-рейтинг. Потемкин Е.Л., 2004).
Число набранных очков.
«Методика подсчета КМ-рейтинга не учитывает ни возраст спортсмена, ни показанный им на дистанции результат (время).
Начисленные за дистанцию рейтинговые очки зависят исключительно от количества принявших участие (финишировавших) на данной дистанции спортсменов и занятого самим спортсменом места. При этом за 1-е место начисляется количество очков, равное количеству финишировавших на дистанции спортсменов. За каждое последующее место начисляется на 1 очко меньше. Таким образом, последний спортсмен на дистанции получает 1 очко». (Легкая атлетика. Положение, 2003).
Баланс забитых и пропущенных мячей, шайб, выигранных и проигранных партий, соотношение нанесенных и пропущенных ударов в боксе или фехтовании, других реализованных действий (Полозов А.А., 1994).
ПОДВЕДЕМ ИТОГИ
В качестве информационной основы рейтинга разные авторы предлагают использовать множество промежуточных параметров. Что такое набранные очки? Это самая простая система рейтинга. Она состоит из одного арифметического действия. Зачем использовать посредника в виде очков? Ведь тогда на одну систему рейтинга накручивается уже другая система, зависимость становится сложной, нелинейной. Начисление бонусных баллов — это уже тройная «накрутка». Сначала один спортсмен выигрывает у другого. Затем он получает очки. По очкам он получает место. За место дают бонусные очки. Бонусные очки формируют собственно рейтинг. Не намного лучше сложение фактически набранных очков с бонусными. Это ничего не меняет. Занимаемое место не может быть информационной основой рейтинга, поскольку рейтинг должен определять место, а не наоборот. Рейтинг, который определяется по месту, больше похож на больного, вынужденного опираться на костыли. Для того чтобы определить информационную основу рейтинга, необходимо просто заглянуть в правила. Если задачи обеих команд — забивать голы, то именно баланс голов должен быть информационной основой. Если в качестве задачи провозглашается количество нанесенных уколов, сбитых кеглей, время движения по дистанции, количество выполненных приемов и других реализованных действий, то именно их баланс должен быть принят в качестве информационной основы.
1.4.2. Масштаб работы шкалы рейтинга: каждое набранное очко, гейм, сет, партия, матч, турнир…
«Победа в круговом турнире MastersCup— 20 очков, выход в финал — 40, победа в финале — 50, не проигравший на турнире ни одного матча — 150 очков» (Теннис, система АТП).
«Классификационные очки начисляются игроку за: 1) занятые места в турнирах РТТ; 2) продемонстрированную в матчах с другими теннисистами силу игры.
При этом на количество начисленных игроку очков влияют показатели силы игры соперников и классификационные номера побежденных теннисистов, категория турнира и состав участников турнира» (Теннис. Положение, 2004).
ПОДВЕДЕМ ИТОГИ
Основной тенденцией развития современного спорта является повышение плотности результатов. Желание учесть просто факт победы (как в теннисе) неизбежно ведет к огрублению оценки, потери основной части информации — как выиграл, с каким преимуществом. Есть разница — с каким преимуществом выиграли. За желание работать в упрощенном варианте придется платить большим числом играемых встреч. Чем дальше, тем большее число участников будет располагаться на одном уровне из-за недостаточной дифференцированности результатов. И, чтобы «развести» их по сетке, нужно будет играть больше. То есть, с одной стороны, часть информации сбрасывается при подсчете рейтинга, а с другой стороны, ее нехватка требует все большего числа игр.
1.4.3. Какой период соревнований оценивается рейтингом — месяц, год, два, десять лет?
Весь период участия в соревнованиях спортсмена или команды.
«Рейтинг должен отражать достижения команд не за последние год или два, а по крайней мере за несколько лет, чтобы отдельные удачные или неудачные периоды не приводили к резкому перемещению команды в рейтинге, поэтому рейтинг ведется непрерывно начиная с 1950 г., так что сумма очков каждой команды получается добавлением или вычитанием очков, полученных в очередном матче» (Божков А.В., 2004).
«Строится 2 вида рейтинга:
- текущий рейтинг (чемпионская гонка по итогам текущего года);
- кумулятивный рейтинг (с учетом текущих рейтингов за прошлые годы)», (Армрестлинг. Положение, 2004).
Неопределенный период, значение которого спрятано в формулу пересчета рейтинга
Инициатором такого направления выступает Арпад Эло (1963). Коэффициент 10 при пороговой разнице в рейтингах 200 косвенно указывает на то, что рейтинг соответствует результатам последних 20 партий. Это значит, что если участник сыграл 40 партий, то в зачет пойдут только последние 20. Если участник сыграл в этом году 10 партий и в прошлом году тоже 10, то его рейтинг соответствует среднему значению за интервал в два года. При этом рейтинги его оппонентов менялись, и вся эта сложная картина наблюдается в колебаниях рейтинга. Таким образом, использование формул, аналогичных А. Эло, неизбежно предполагает свой временной интервал оценки для каждого из участников.
Три года
«Величина рейтинга для спортсмена на текущий год определяется результатами, показанными им во всех зачетных полетах, в которых он участвовал за три предшествующие года». (Планерный спорт. Положение 1997).
Четыре года
«Традиционный волейбольный рейтинг составляется по результатам выступлений команд на крупнейших международных соревнованиях за последние четыре года. Причем количество набранных очков на Олимпиадах и чемпионатах мира ежегодно сокращается на 25%, на соревнованиях, проводимых раз в два года, на 50% и на проводящихся каждый год «Гран-при» и Мировой лиге — на 100%».
52 недели
(Теннис. Положение, 2004).
Один год
«В сумму рейтинга любителя бега включаются очки 6 лучших результатов сезона». (Бег. Положение, 2003).
«Назовем рейтингом смещенный в область целых положительных чисел результат участника всеобщего гипотетического кругового годичного макротурнира» (Полозов А.А., 1995).
ПОДВЕДЕМ ИТОГИ
Спектр мнений чрезвычайно широк — от одного месяца до всего периода спортивных соревнований. Обе крайности неприемлемы. Зачем любителю спорта, посетившему соревнования сегодня, знать итоговый за последние 25 лет результат? Будет ли тренер, выбирающий игрока в команду, руководствоваться его достижениями 10-летней давности? В некоторых случаях подводят результаты за четыре года, имея в виду Олимпийские игры, чемпионаты мира в некоторых видах спорта. В этом вопросе необходимо принять решение, которое бы не исключало возможности получения рейтинговой оценки за любой период. Однако приоритет следует оставить за наиболее устоявшимся периодом оценки. Мы привыкли к тому, что чемпионом страны за такой-то год стал такой-то.
За другой год — кто-то другой. Подавляющее число соревнований во всех странах имеют период их проведения один год. Никогда не приходилось слышать о чемпионах 2001—2003 гг. А вот о чемпионах 2001, 2002 и 2003 гг. приходится слышать постоянно. Нужно уважать сложившиеся в обществе традиции. Для этого периодом работы рейтинга следует признать календарный год или сезон. Тогда из рейтингов за каждый год четырехлетия можно получить средний рейтинг за четыре года. И вообще — можно получить рейтинг за любой период. В то же время рейтинг за период в 1 месяц недостоверен, поскольку невозможно за этот период провести столь масштабные соревнования и оценить соотношение сил. Рейтинг за столь малый период неизбежно будет вынужден опираться на результаты за значительно более долгий срок. Вопрос о выборе периода работы рейтинга — это вопрос уважения к сложившимся в обществе традициям и удобства обобщения рейтинга на любой период противостояния.
1.4.4. Какими свойствами должна обладать выбранная для подсчета рейтинга функция?
Непрерывность, монотонность. «Естественно потребовать, чтобы отношение
в качестве функции f(Ar), оценивающей различие в классе игры спортсменов, удовлетворяло следующим условиям:
- f(Δr) > 0 при любых значениях Δr,
- f(Δr) монотонно возрастает относительно Δr, т.е. если Δr< Δr, то f(Δr) < f(Δr),
- f (0) = 1.
Среди основных элементарных функций этим трем условиям удовлетворяет лишь показательная f(Δr) = aΔr(при некотором а>1)». (Садовский А.Л., Садовский Л.Е., 1989).
Антикоммутативность, ограниченность интервала
«Функция должна:
1.Обладать свойством антикоммутативности:
F(З, П) = F(П, З).
2.Работать в избранном числовом интервале, а не по всей шкале.
3. Не выходить за пределы четырех действий арифметики и обеспечить минимальное число арифметических действий при пересчете рейтинга.
4. Свести к минимуму суммарную разницу между результатами участников в личной встрече и их общими результатами». (Полозов А.А., 1995).
ПОДВЕДЕМ ИТОГИ
В разделе затронута тема, по которой мало исследований. Обычный подход — «возьмем такую-то функцию» — представляет собой навязывание первой попавшейся под руку зависимости людьми, не желающими утруждать себя мотивировкой выбора. А между тем со стороны общества есть совершенно определенные пожелания. Если задать вопрос обыкновенному спартаковскому фанату, то какую функцию он бы предпочел? Конечно, речь пойдет о функции, состоящей только из арифметических действий. Никаких логарифмов, тройных интегралов тонкая нервная система фаната не выдержит. Другим, не явно выражаемым требованием будет антикоммутативность. Если победившей команде начисляют за победу не столько же очков, сколько проигравшей, то это уже нелинейная, непонимаемая зависимость, от которой рядовой болельщик откажется. Сам фанат назовет вам массу примеров, когда нет борьбы за результат, и скажет, что такие игры не стоит включать в рейтинг. Это значит, что функция должна действовать в определенном интервале. Но все же главным будет другое требование — сходимость модели. Должна быть уверенность, что разница в рейтингах на личную встречу будет соответствовать разнице в рейтингах в рамках всего проводимого турнира. Иначе к результатам нет доверия. Конечно, такой перевод слов обыкновенного фаната можно было бы считать литературным. Однако нельзя не видеть вполне определенных не высказанных обществом любителей спорта пожеланий и тем более игнорировать их.
1.4.5. Необходимое для подсчета рейтинга распределение должно быть задано в виде функции или таблицы значений?
В виде таблицы
(А. Эло, 1963), (Шахматы. Положение, 2003), (Шашки. Положение, 2003), (Студенческий союз дзюдо. Положение, 2003), (Спортивное ориентирование. Положение, 2001).
В виде функции
«Известно несколько вариантов построения шкалы рейтинга, что предполагает множество решений проблемы. Наиболее удобным представляется такое решение, которое можно записать в аналитическом виде (обойтись без табличек), состоящее из минимального числа только арифметических действий при пересчете рейтинга общеизвестным способом» (Полозов А.А., 1999).
«Шахматный статистик наших дней имеет огромное преимущество в виде мощного компьютера и миллионов партий, которые могут служить эмпирическим доказательством его выводов. В то время, когда А. Эло предложил свою таблицу, таких возможностей у него, конечно, не было. В наши дни мы можем проверить точность теории профессора Эло (см. главу 4 — А.П.).
Согласно базе из 266 000 партий за период с 1994 по 2001 г., прямая линия лучше помогает предсказать результат, нежели таблица Эло. Цифры Эло (белая кривая) основаны на теоретических вычислениях. Эта инверсионная экспоненциальная дистрибуция столь сложна, что дать простую формулу для расчета рейтингов просто невозможно. Остается обращаться к специальным таблицам. Мне непонятно, почему все должно быть так сложно. Взгляните на черную линию на графике. Эта прямая линия подкреплена конкретными партиями и более точно описывает ситуацию, нежели кривая Эло. К сожалению, для того чтобы делать выводы о результатах за пределами интервала +/— 400, данных недостаточно, однако в пределы вышеупомянутого интервала укладываются 99% всех официальных партий. У меня существует собственная теория о том, в чем состоит ошибка в вычислениях Эло. Как бы то ни было, одно совершенно очевидно: формула Эло может быть существенно улучшена» (Сонас Д., 2002).
ПОДВЕДЕМ ИТОГИ
Подведение итогов с помощью таблицы — свидетельство того, что проблему решить не удалось. Не удалось найти такой простой функции, которая бы обеспечивала выполнение задачи, и в качестве компенсации предлагается таблица. Всегда хочется большего. Всегда хочется иметь возможность, пусть даже с калькулятором, посчитать результат. А для этого хочется иметь только калькулятор, а не калькулятор и таблицу. Все же, учитывая, сколько людей будут пересчитывать рейтинг после одного-единственного результата и сколько таких результатов вообще, желательно довести дело до логического завершения и найти функцию. Все же таблица воспринимается промежуточным, нетехнологичным, а потому временным вариантом.
1.4.6. Является ли «нормальным» распределение функции вероятности выигрыша?
Да, является
(Теннис. Положение, 2003).
Нет, не является
«А кто-нибудь где-нибудь встречал обоснование (строгое в научном плане), вида функции вероятности?.. Чисто экспоненциальная форма в РС ЕГФ и некоторых других — просто аппроксимация функции распределения нормального закона, т.е. интеграла от e–x2). С другой стороны, и исходная интегральная функция распределения с экспоненциальной плотностью (Гаусс), и ее аппроксимации экспоненциального вида в точке DR=0, соответствующей равным соперникам (вероятность равна 1/2), имеют некоторую первую производную, т.е. тангенс угла наклона графика. Во всех моделях этот наклон почему-то разный: в ЕГФ зависит от уровня игрока, в АГА равен (0,83—0,5)/1 дан, в действующей российской (0,66—0,5)/1 дан.
А вторая производная во всех моделях в этой точке равна нулю, т.е. все эти функции в окрестности точки DR=0 ведут себя как линейные функции от DR, с точностью до членов третьего по DRпорядка. Последние тщательные исследования статистики ЕГФ (108 631 партия!) окончательно опровергли предположение о «нормальности» вида функции вероятности. Кстати, угол наклона, упоминавшийся выше, в российской РС «в среднем» по группе данов соответствует статистике. Это и понятно, так как в 1990 г. конкретные параметры функции вероятности (и значит угол наклона в точке DR=0) были рекомендованы исходя из российской статистики по группе данов (усредненно). Правда, статистика была куда скромнее сегодняшней европейской — всего-то около 400 партий. Но факт остается фактом! Значит, статистические данные в этой группе имеют высокую устойчивость и выявленным по ним закономерностям можно доверять. Итак, нормальная форма для функции вероятности не годится (а жаль!)» (Павлов С.В., 2004).
ПОДВЕДЕМ ИТОГИ
Нормальное распределение вероятности победы от разницы в рейтингах было всего лишь исходным предположением создателей первых систем классификаций. Они никак, никогда и нигде не обосновывали и не доказывали это. Они это просто предполагали. Однако исследователи в этой области не могли не знать, что существует такой уровень противостояния, когда нет борьбы за результат. Когда для одного участника не проблема прибавить в любой момент и выиграть у другого. Нормальное распределение полагает, что сборная детского сада когда-нибудь, но все-таки выиграет у сборной страны. С моей точки зрения, невозможно определить разницу в рейтингах, если одна команда не в состоянии забить другой. Когда счет растет (1:0, 2:0, 3:0 и т.д.) и когда итоговый счет все равно будет заканчиваться на ноль, то реально определить дистанцию между играющими невозможно. Разница в рейтингах в 1000 пунктов делает противостояние нереальным. Оно превращает встречу в баловство. Если один из соперников не может забить или выиграть у другого, то принципиально невозможно отличить разницу между ними в 1500 и 2500. Она просто не поддается оценке. Для оценки взаимоположения таких участников используются третьи оппоненты, для которых реально побороться за результат и с первыми, и со вторыми.
1.4.7. Какое минимальное число игр должен сыграть участник для получения рейтинга?
Число игр не задано, но за пропуски соревнований штрафуют «Рейтинг игрока, не участвующего в турнирах в течение продолжительного времени (пока оговаривается 5—7 турниров), усредняется с рейтингом 2200» (Пушков С., 2003).
«В случае если спортсмен не принимает участия в обсчитываемых соревнованиях в течение года, его рейтинг ежедневно уменьшается на 1. Именно это, «оштрафованное» значение используется во всех целях» (Настольный теннис. Пояснение к положению. 2004).
Зависит от числа участников официальных соревнований Минимальное число игр определяется из соображений по организации глобального макротурнира и находится в зависимости от числа участников макротурнира. Число два в степени числа игр данного участника должно быть равно общему их числу в макротурнире (Полозов А.А., 2004).
ПОДВЕДЕМ ИТОГИ
В подавляющем числе классификаций вопрос не обсуждается. В оставшейся части классификаций предлагается штрафовать тех, кто уклоняется от соревнований. При этом действия авторов носят скорее инквизиционный характер. Если есть определенный уровень игры, который следует из официальных результатов, то как можно так вольно, по чисто политическим мотивам его понижать? В результате спортсмен окажется ниже тех, кого он обыгрывал, и только из-за того, что пропустил несколько соревнований. Безусловно, это вольность административной власти в виде спорта, которая никем никогда не будет поддержана. Если они пойдут дальше и будут кому-то понижать, а кому-то повышать рейтинг, то рано или поздно встанет вопрос о замене такой администрации, ассоциирующей себя с божественным образом. Приходилось слышать предложения о том, что за избыточную активность нужно поощрять спортсмена. В таком подходе путается между собой уровень игры и активность спортсмена. Вопрос может стоять так: либо допускать в список рейтинга участника, либо не допускать из-за недостаточности его официальных результатов. И уж если он допущен, то никто не вправе произвольно корректировать его уровень. Если не допущен, то его результаты с другими допущенными участниками обнуляются. В этой ситуации к спортсмену относятся уважительно, заранее поставив его в известность о пороговом уровне активности. Но этот порог явно будет зависеть от общего числа участников. Если участников всего двое, то одного официального результата может быть достаточно. А вот если их миллион, то порог неизбежно сдвигается вверх.
1.4.8. Равны ли между собой прирост рейтинга одного соперника и убыль рейтинга другого?
Да, равны
(Шахматы. Положение, 2004.), (Потемкин Е.Л., 2004), (Полозов А.А., 1994).
Нет, не равны
«Обратите внимание, что в системе Глико изменения в рейтинге не столь сбалансированы, как это есть в системе Эло. Если рейтинг одного игрока возрос на xочков, то совсем не обязательно, что рейтинг его соперника уменьшится на те же xочков. Фактически в системе Глико количество очков, на которое уменьшится рейтинг соперника, регулируется значениями RD(“рейтинговое отклонение”) обоих игроков» (Гликман М., 1998).
Новый рейтинг игрока определяется как предыдущий рейтинг, измененный на сумму приращений рейтинга с учетом коэффициента значимости соревнований (КЗС). Приращения рейтинга определяются по итогам встречи в случае, если у победителя рейтинг не больше, чем у побежденного, на 99. В этом случае разница в рейтинге отнимается от 100 и все это делится на 10. Это и будет приращение рейтинга у победителя. У побежденного приращение будет отрицательным и в 2 раза меньше» (Настольный теннис. Положение, 2004).
«За победу над более сильным соперником команда получает больше очков, чем за абсолютно такую же победу над слабым соперником. И наоборот — за проигрыш более сильному сопернику команда теряет меньше очков, чем за такой же проигрыш слабому сопернику» (Божков А.В., 2004).
ПОДВЕДЕМ ИТОГИ
Неадекватность прироста и убыли рейтинга можно понимать как проявление нелинейности модели. Эта нелинейность может преследовать разные цели. В одних случаях авторы пытаются отсечь некоторую долю проходных матчей, где нет борьбы. В других случаях не явно формируется некий потолок рейтинга, который никому не дозволено достичь. В третьих случаях речь идет просто о проявлении нелинейности, на которой построена модель. В четвертых случаях речь идет о степени девальвации прироста рейтинга по линии слабый — сильный спортсмен. Правда, при этом забывают, что если слабому вообще очков не давать, то он никогда не станет сильным. Предположим, что у рядового зрителя есть выбор в подсчете рейтинга по линейной и нелинейной модели. Очевидно, что он выберет линейную модель, где прирост равен убыли рейтинга. Следовательно, все предложения по нелинейным моделям носят временный характер до появления линейной модели. Не могу не процитировать строчку из письма мне автора системы рейтинга на основе теории графов в настольном теннисе г-на Сухова в 1996 г.: «Вы сумели найти для чисто нелинейной задачи вариант линейного решения». Вместе с линейностью отпадут всякие «шалости» авторов классификаций с балансом прирост — убыль.
1.4.9. Можно ли рассчитать рейтинги всех участников двух изолированных друг от друга турниров?
Да, возможно
(Рейтинг Р1РЛ/Соса-Со1а, 2003), (Армрестлинг. Положение, 2003), (Го, 2003), (Теннис, 2003), (Студенческий союз дзюдо, 2003).
ПОДВЕДЕМ ИТОГИ
Если один турнир проводится на Марсе, а другой — на Венере, то при отсутствии официальных встреч между собой общий список рейтингов создать нельзя. Можно только создать два списка — один на Марсе, другой — на Венере. Обычно создают один список, полагая, что средний уровень подгрупп одинаков. Однако за всю историю футбола FIFAни разу не смогла создать равные по силам группы. Поэтому ее рейтинг никогда не соответствовал итоговым результатам чемпионатов мира. И когда официальные лица выходят из положения, просто присваивая одинаковый средний рейтинг участникам изолированных турниров, я говорю им: «Докажите!» Чем можно доказать равенство? Официальными результатами, которых нет. Тогда давайте объявим участников на Марсе премьер-лигой (все-таки Марс!), а участникам на Венере присвоим статус первой лиги. Поскольку официальных результатов нет, то ни подтвердить, ни опровергнуть оба предположения невозможно. Так как же быть? Нужны официальные матчи. Прототипом такой ситуации являются вполне земные примеры, когда в рамках города, области, страны участники увлечены игрой между собой.
1.4.10. Следует ли учитывать в расчетах результаты встреч между собой соперников разного класса?
Да, следует
(Рейтинг FIFA/Соса-Соха, 2003), (Армрестлинг. Положение, 2003).
Нет, не следует
«В результате встречи с соперником Приращение Рейтинга определяется:
3.3.1. равным 0 — в случае, когда разница Рейтинга Текущего выигравшего и проигравшего (РТВ-РТП) превышает значение 100» (Настольный теннис. Положение, 2004).
ПОДВЕДЕМ ИТОГИ
Вопрос о разнице в рейтингах, при которой не следует учитывать результат встречи, чрезвычайно важен с точки зрения корректности результатов. Всегда найдутся такие команды или спортсмены, во встрече которых счет будет WW:0 в пользу одной из сторон. Если другая сторона не в состоянии забить хотя бы один гол, то борьбы не получится. В этом случае исключение таких результатов означает, что о соотношении сил сторон лучше судить через встречи с третьими лицами. Если, например, я выиграл 10:0, то будет лучше вместо этого результата использовать мой результат 6:1 с другим участником, который, в свою очередь, выиграл у моего нынешнего оппонента, скажем, 5:2. Тогда можно реально оценить соотношение сил. Если разница в рейтингах 1500 и 2500, то судить о ее значении из игр невозможно — и в том, и в другом случае счета будут заканчиваться «на ноль».
1.4.11. Чему равно исходное среднее значение рейтинга в разных классификациях?
0
«Если игрок до соревнований не был классифицирован в рейтинг-листе, то для подсчета ему присваивается начальный рейтинг, равный 0». (Настольный теннис. Положение, 2003).
1000
«В первоначальных вариантах за основу оценки результатов по скорости было взято правило: вне зависимости от местности участнику, показавшему средний результат пятерки лучших на дистанции элиты, назначается 1000 очков». (Ориентирование. Положение, 2004).
1100
«Вновь заявленные пары получают начальный рейтинг 1100» (Чебышев Н., 2004, Конный спорт).
1500
(Гликман М., 1998). 2200
(Эло А., 1963).
…Такое, чтобы рейтинг самого слабого из участников был числом положительным.
«Назовем рейтингом смещенный в область целых положительных чисел результат участника… » (Полозов А.А., 1994).
ПОДВЕДЕМ ИТОГИ
Средний рейтинг, который присваивается на старте всем участникам, действительно может быть любым. От его значения ничего не зависит в расположении участников. Оно может зависеть только от разницы в рейтингах, а в этом случае, будут ли оба числа больше на 1000 или меньше, уже не играет никакой роли. Средний рейтинг задается исключительно из соображений удобства. Если каждый раз говорить «его рейтинг минус 430 целых 62 сотых пункта», то от необязательных «минус» и «сотых пункта» рано или поздно захочется избавиться. И чем активнее будут говорить эти слова, тем раньше захочется. Нужно избавить текст от слов-«сорняков». Для этого, раз уж все равно, каким будет средний рейтинг, лучше его поднять до 2000, 3000 и избавить себя от необходимости проговаривать малоинформативные слова-«сорняки». Однако на сколько поднимать? До миллиона? Здесь нужно учесть ряд психологических мотивировок. Желательно, чтобы рейтинги имели тот же порядок чисел, которым мы привыкли пользоваться в реальной жизни. В реальной жизни чаще всего мы сталкиваемся с числами, когда платим деньги за вещь, услуги. Наиболее часто используемыми рядовыми гражданами числами бывают относительно небольшие величины типа 100, 1000, 2000. Такой подход не потребует от рядового гражданина дополнительных усилий по адаптации к рейтингу. С другой стороны, раз уж мы решили избавиться от сорняков, то средний рейтинг всех участников следует приподнять так, чтобы рейтинг самого слабого из участников все еще был числом положительным. Если это правило, то для всех и без исключений. Еще одним психологическим мотивом следует считать приоритет работы А. Эло. Он обозначил средний рейтинг числом 2200, и оно вписывается в поле выбора, очерченное предыдущими соображениями. Мы можем критиковать Арпада Эло, но мы должны быть ему благодарны за открытие темы рейтинга, за высокое качество его работы. Поэтому лучше всего сохранить в модели будущего рейтинга какие-то предложенные им составные. Например, значение 2200. Это будет данью нашего уважения к выдающемуся ученому.
1.4.12. Средний рейтинг всех участников должен корректироваться или всегда быть постоянным?
«Для привязки всей системы, обеспечения меньшего смещения общего рейтинга вся совокупность игроков разбивается на несколько групп по уровням игры и регулярно делаются поправки, рассчитываемые по изменению рейтинга наиболее стабильных игроков (анкеров) из верхней части каждой из выделенных групп. Все параметры РС контролируются и уточняются на основе мониторинга РС с использованием современных методов статистической обработки экспериментальных данных» (Павлов С.В., 2004).
ПОДВЕДЕМ ИТОГИ
Нет ни одной классификации, в которой средний рейтинг спортсменов корректировался бы со временем. Между тем мы не можем отрицать развитие спорта. Полагаю, что тех, кто отрицает факт развития спорта, найти трудно. Складывается противоречие, которое как-то должно решаться.
Мы не можем, не имеем реальной возможности сравнить участников разных поколений. Но мы понимаем, что их силы неравны. Те, кто пришел после них, объективно сильнее. Но насколько? В этой связи вспоминаются некоторые законы физики. Если мы находимся внутри замкнутой системы, которая движется без ускорения, то узнать, с какой скоростью она движется и куда, мы никак не сможем. Но вот как только система начинает двигаться с ускорением, такая возможность у нас появляется. Независимые друг от друга участники макротурнира будут и прогрессировать независимо. Сначала одни вырываются вперед за счет новых методических, тактических решений. Потом другие. В системе беспрерывно совершаются ускоряющие действия. Плотность расположения участников то растет, то падает. Это единственный вариант корректировки среднего рейтинга макротурнира. Вполне логично ожидать, что средний рейтинг растет по логистическому виду зависимости, как и результаты во всех видах спорта.
1.4.13. Применим ли принцип транзитивности к рейтингу в спорте?
Нет, не применим
Если «Спартак» выиграл у «Динамо», а «Динамо» выиграло у «ЦСКА», то «Спартак» точно выиграет у «ЦСКА»? Широко распространено мнение, что этого не может быть — принцип транзитивности в спорте нарушается сплошь и рядом. Поэтому он не применим к спорту.
Да, применим
«Одной из основ любой рейтинговой классификации является принцип транзитивности» (Садовский А.Л., Садовский Л.Е., 1986).
ПОДВЕДЕМ ИТОГИ
Принцип транзитивности по факту используется формулами всех крупных соревнований, поэтому дискуссии по факту уже давно нет. Само деление команд на равные по силам группы предполагает неявное использование транзитивности. Основную интригу в дискуссию по теме внесли А.Л. Садовский, Л.Е Садовский. Они определили транзитивность как математики: если А>В, а B>C, то A>C. Именно в ответ на это и пошли примеры о «Спартаке», «Динамо». Следовательно, принцип надо уточнить. Если участник А предпочтительнее участника Б по совокупности результатов на протяжении всего сезона, а Б аналогично предпочтительнее С также по всей совокупности зафиксированных в течение года результатов, то уровень А выше, чем уровень С. В такой редакции исчезают примеры с московскими дерби и ситуация переходит в конструктивную плоскость. Транзитивность позволяет провести макротурнир без обязательной встречи каждого с каждым. А зачем играть А с С, если А уже играл с В, а В уже сыграл с С ? Тем самым создается возможность превратить круговой макротурнир в гипотетический, когда можно играть не все игры. Уровень игры, определенный на основе полученной части результатов, экстраполируют на всю сумму игр. Отсутствие этого принципа означает требование встречи каждого участника макротурнира со всеми остальными, что не имеет перспективы.
1.4.14. За счет чего может быть обеспечено единственно возможное распределение рейтингов?
За счет использования теории графов
(Сухов А., 1980).
За счет использования закономерностей математической статистики
(Мальковский Е., 1993), (Потемкин Е., 2004).
За счет большого числа пересчетов рейтинга
Под асимптотической устойчивостью результатов Л.Е. Садовский, А.А. Садовская понимают достижение устойчивого равновесия результатов в рамках любой действующей классификации. Имеется в виду то, что если бесконечное число раз пересчитывать те же самые данные, то рано или поздно они перестанут изменяться и станут константами (Садовский Л.Е., Садовская А.А., 1985).
ПОДВЕДЕМ ИТОГИ
Исследователи рейтинга всегда забывают, что, последовательно выписывая уравнения для участников, они используют систему линейных уравнений, которая может иметь или не иметь решений. Возможны и другие варианты обеспечения асимптотической устойчивости результатов. Например, теория графов. Однако предпочтение следует отдать именно системе линейных уравнений, которую изучают в школе и поэтому знают все. Нельзя требовать от рядового спортсмена знания всех разделов математики. Недопустима ситуация, когда спортсмену посчитали рейтинг, а он не может проверить правильность цифр из-за незнания, скажем, теории графов. Нужно понимать, что участники соревнований вправе отвергнуть систему, основанную на непонятном для них механизме пересчета, и это их право необходимо уважать. Первое условие любого соревнования — это прозрачность результатов. В случае с системой линейных уравнений участнику для проверки правильности подсчета его рейтинга нужно знать свои результаты и рейтинги своих соперников. Все действующие классификации в неявном виде используют систему линейных уравнений. Пора это положение закрепить явным способом.
1.4.15. Изменения рейтинга определяются после каждой очередной встречи или же после соревнования в целом?
После каждой встречи
«3.3. В результате встречи с соперником Приращение Рейтинга определяется:
3.3.1. равным 0 — в случае, когда разница Рейтинга Текущего выигравшего (РТВ) и проигравшего (РТП) превышает значение 100,
3.3.2. иначе по формуле:
- выигравшему: ПР=(100—РТВ+РТП)/10
- проигравшему: ПР=(100—РТВ+РТП)/(—20)»
(Настольный теннис. Положение, 2004). После соревнования в целом (Эло А., 1963).
«1. Рейтинг соревнования считается как среднее арифметическое рейтингов участников» (Чебышев Н., 2004, Конный спорт).
И после каждой встречи, и после соревнования в целом «Принцип трансляции в глубину призван обеспечить неизменность, преемственность способа пересчета рейтинга при переходе с макроуровня на последующие нижележащие слои, от уровня команд на уровень составляющих ее игроков, от уровня игроков — на уровень их базовых компонентов игры, и наоборот. Он предполагает возможность замены нескольких соперников одним, им эквивалентным» (Полозов А.А., 1994).
После нескольких соревнований в течение года
«7. В зачет рейтинга идет сумма баллов десяти лучших стартов» (Положение о рейтинге сильнейших спортсменов России по спортивному ориентированию бегом, 2004).
«Для каждого участника суммируются его пять лучших результатов за предыдущий календарный год» (Парусный спорт. Положение, 2004).
ПОДВЕДЕМ ИТОГИ
Необходимо добиться такого положения, когда пересчет рейтинга возможен как угодно: в ходе соревнования или по его завершении. Это проблема создателей систем рейтинга, а не ее пользователей. При этом не должно быть разницы, если считать рейтинг последовательно от результата к результату и если считать рейтинг по итогам всего турнира. Известно большое число парадоксов, которые связаны с несходимостью этих чисел. Практически все они связаны с выходом за пределы неявно используемых систем линейных уравнений. Разница в этих вариантах в том, что средний рейтинг оппонентов в обоих случаях разный. Для того чтобы не было разницы в подсчитанных результатах последовательно по ходу турнира или по турниру в целом, необходимо уметь представлять всех оппонентов спортсмена в некоего соперника с рейтингом, эквивалентным им. Это вопрос эквивалентности такой замены, при которой к концу турнира оба прототипа оппонентов становятся равнозначными.
1.4.16. Нужно ли учитывать в рейтинге факторы, создающие неравные условия, или нет?
Нет, не нужно
(Эло А., 1963).
Возможно, в виде исключения
«По представлению ФНТ субъекта РФ, решением секретаря ФНТР в субъекте РФ значение рейтинга может быть изменено конкретному спортсмену. Причины могут быть разные, однако цель всегда одна — приведение в соответствие (практически — исправление ошибки) рейтинга игрока. Это изменение, как правило, не применяется и может использоваться в исключительных случаях» (Настольный теннис. Положение, 2004).
Необходимо
«Существуют факторы (m), влияющие на итоговый результат и создающие неравные условия для участников. Выявление значения любого фактора предполагает сравнение результатов участника до и после его воздействия при нивелировании всех остальных. Компенсация суммы таких независимых, невзаимодействующих факторов должна быть равна сумме их компенсаций. Тогда официальным итогом соревнований будет рейтинг участника, скомпенсированный по всем выделенным факторам (чужое поле, климат, пол, возраст…)» (Полозов А.А., 1994).
«В системе «по занятым местам» кроме очков, начисляемых за занятое в турнире место, дополнительно начисляются премиальные очки (бонусы) за победу над игроком (парой игроков), имеющим большее количество очков по классификации ФТУ или СНГ в одиночном или парном разрядах» (Украинская теннисная классификация. Положение, 2004).
ПОДВЕДЕМ ИТОГИ
Это вопрос, который может быть поднят в рамках классификации высокого уровня. Конечно, не равны между собой белые и черные фигуры в шахматах. Трудно не согласиться с тем, что на любом турнире хозяева имеют завышенный результат. В теннисе считается большой проблемой взять чужую подачу. Понятно, что тот, кто бежит по дистанции после своего основного соперника, знает его время и имеет преимущество. В футболе хозяева забивают вдвое больше гостей. Но вот как это преимущество нейтрализовать в оценке? Поэтому вопроса, надо компенсировать или не надо, наверное, нет. Вопрос стоит: а как это лучше сделать? Должна ли такая компенсация быть сбалансированной — сколько прибавили одним, столько же отняли у других? На сегодняшний день, при нерешенности этого вопроса на уровне классификаций, проблему решают на уровне проведения соревнований. В футболе команды по очереди играют дома и в гостях. В теннисе подают также по очереди. В шахматах играют две партии обоими цветами. Однако определение механизма компенсации может позволить сократить необходимый минимум игр для расширения масштабов турнира.
1.4.17. Является ли значение рейтинга точным числом или же речь идет о некотором интервале шкалы рейтинга?
Да, рейтинг — число точное
(Эло А., 1963).
Нет, рейтинг — это интервал расположения участника с вероятностью 95%.
«Проблема системы Эло, которую исправляет система Глико, — это достоверность рейтинга игрока. Предположим, что два игрока, оба с коэффициентом Эло в 1700, встречаются на турнире и первый побеждает второго. По версии Американской шахматной федерации системы Эло первый игрок получит в этом случае 16 рейтинговых очков, а второй игрок потеряет те же 16 очков. Но предположим, что первый игрок только что вернулся к играм на турнирах после многих лет «отдыха», а второй игрок режется в шахматы каждый выходной. В этой ситуации рейтинг первого игрока в 1700 очков является не совсем достоверным отражением его силы, в то время как рейтинг второго игрока в 1700 является вполне реальным отображением его игрового мастерства. Моя интуиция подсказывает мне, что (1) рейтинг первого игрока должен увеличиться намного (больше 16 очков), поскольку его рейтинг не совсем реален, и то, что он побил игрока с практически точным рейтингом в 1700, наводит на мысль, что его сила заведомо превышает 1700; и (2) рейтинг второго игрока должен немного уменьшиться (менее 16 очков), поскольку про его рейтинг и так уже известно, что а) он находится в районе 1700 и б) он проиграл игроку, чей рейтинг не заслуживает доверия, и потому о его собственной игровой силе могут быть сделаны лишь небольшие догадки. Хотя большинство ситуаций не столь экстремальны, мне кажется, что в систему ранжирования полезно включить меру достоверности чьего-либо рейтинга. Потому-то система Глико и превосходит систему Эло, что вычисляет не только рейтинг R, который может быть представлен, как «наилучшая догадка» о чьей-либо игровой силе, но и «рейтинговое отклонение» (RD) (в статистической терминологии — стандартное отклонение), которое измеряет неопределенность рейтинга. Высокие RDотвечают ненадежным рейтингам, указывая, что игрок выступает не часто или что игрок участвовал лишь в небольшом количестве игр. Низкий RDуказывает на то, что игрок постоянно принимает участие в турнирах… Так, например, если чей-либо рейтинг равен 1850 и RDравно 50, то интервал будет простираться между 1750 и 1950. Мы можем сказать тогда, что мы на 95% уверены, что реальная сила игрока находится между 1750 и 1950. Если у игрока низкий RD, то интервал будет уже и мы будем на 95% уверены в реальной силе игрока в меньшем интервале значений» (Гликман М., 1995).
Рейтинг всегда определяется с погрешностью
«Если участник имеет рейтинг 2300, забив и пропустив в свои ворота 20 мячей за сезон, то погрешность определения его рейтинга равна: 2000/20=100 пунктов по шкале рейтинга. В этом случае правильнее говорить о результате 2300 ± 50 пунктов. Естественно, что если сумма забитых и пропущенных мячей увеличится до 200, то интервал сократится — 2300+5. Поэтому одним из условий корректности проведенных соревнований является превышение плотности результатов (средний интервал расположения между участниками) над погрешностью их определения»
(Полозов А.А., 1994).
ПОДВЕДЕМ ИТОГИ
Я с большим уважением отношусь к мнению профессора математики Гликмана и последовавшими за ним работами по определению интервала расположения спортсмена. Полагаю, что поднята еще одна проблема, которую так или иначе предстоит решать. Однако вызывает недоумение сама манера изложения материала. Не изложены основополагающие идеи механизма. Есть только формулы. К сожалению, в них без помощи самого профессора нам не обойтись. Нет примеров, иллюстрирующих суть дела. Кажется странным разное количество очков за выигрыш и проигрыш, определяемое на основе «рейтингового отклонения». Отклонение определяет сам рейтинг — это непонятно. А как же тогда стабилизировать средний рейтинг всех участников? Теперь нужно считать и рейтинг, и интервал, и достоверность. Таким резким усложнением всей процедуры мы должны платить за желание наказать некоторых спортсменов, не участвующих полгода в турнирах? Кажется наиболее вероятным решением проблемы тот тезис, что рейтинг всегда определяется с погрешностью, и важно, чтобы к концу сезона эта погрешность стала меньше среднего расстояния между соседями по шкале рейтинга.
1.4.18. Соответствуют ли результаты официальных соревнований положению участников в рейтинге?
Нет, не соответствуют
«Издержки соревнований в виде пенальти, жеребьевки, не-дифферинцированности результата (те же очки за 1:0 и 11:0) неизбежно формируют несоответствие результатов соревнований реальному соотношению сил. Возьмем результаты любого кругового турнира и произвольно исключим некоторую их часть, с таким расчетом, чтобы обозначилась та или иная формула. Оценим степень сходимости результатов кругового макротурнира с результатами на основе выбранной формулы.
- Олимпийская формула. Отметим очень широкий диапазон сходимости результатов в зависимости от случайности выбора — от 40 до 60%. К последней отметке (60%) он подходил в случаях относительно равномерного рассеивания сильнейших команд.
- Смешанная (зонально-олимпийская) формула. Процент соответствия колебался в интервале 70—90%. Среднее значение составило 82%.
- Круговая формула. Круговую формулу по определению считаем 100%, хотя более правильно говорить о 95% из-за погрешности очковой схемы интерпретации (Полозов А.А., 1995).
1.4.19. Создают ли искажения полуизолированные микротурниры?
Да, создают
«Самую серьезную трудность для любой системы рейтинга представляет собой проблема полуизолированных микротурниров.
Проблема полуизолированных микротурниров — это проблема замедленного обмена информацией между различными участниками макротурнира. Просматривается два пути ее решения. Первый связан с преодолением стихийности макротурнира. Необходимо просто проводить турниры в рамках тотального макротурнира по рейтинг-формуле, в которой невозможно существование ни изолированных, ни полуизолированных микротурниров. Второе направление связано с тем, чтобы корректировать состав участников любого турнира с учетом фактуры полуизолированных микротурниров. Желательны такие турниры, которые сокращают связь между двумя произвольно выбранными участниками. Это все касается формы с ручным пересчетом каждым участником своего рейтинга. Однако более правильным представляется подход, при котором каждый день рейтинги пересчитываются и «выбрасываются» в Интернет, а каждый участник имеет возможность из рейтингов его оппонентов и своего сверить свое уравнение в системе линейных уравнений. При этом условием является минимальное число игр участника» (Полозов А.А., 2004).
1.4.20. Какие парадоксы возникают при расчетах рейтинга?
«Снято необоснованное упрощение правила подсчета ожидаемого результата. Оно состояло в том, что, вместо того чтобы просуммировать ожидаемые результаты по всем партиям, вычисляется средний рейтинг соперников и считается, что все партии играются с таким «усредненным» соперником. Это приводит к нарушению закона «сохранения», то есть суммы рейтингов до и после турнира не равны (это без учета округлений). Желающие могут в этом и сами убедиться, если представят себе гипотетический турнир, в котором участвуют трое, у двоих из которых одинаковый рейтинг, а у третьего значительно ниже. После такого турнира общая сумма рейтингов уменьшится на величину, приближающуюся к пяти пунктам (при уменьшении рейтинга третьего).
Снят недостаток системы, при котором при большом количестве партий рейтинг изменяется неограниченно сильно. Пример: двое с рейтингом 2400 играют матч из большого числа партий, причем первый набирает в каждых двух партиях по 1,5 очка. Тогда у него после каждых двух партий рейтинг будет возрастать на 5 пунктов и после 240 партий достигнет 3000. Напрашивается справедливый вывод: рейтинг надо считать после каждой партии (это относится не только к матчам, но и к турнирам). Тогда в этом примере рейтинг сильнейшего стабилизируется у 2500, а слабейшего у 2300, как и должно быть. Однако, конечно, вряд ли кто возьмется считать рейтинги по каждой партии отдельно, да и не всегда порядок партий можно установить. Поэтому реализуется простой выход из положения: все же считается матч (турнир) целиком, но не за один заход, а за nзаходов, где в формуле подсчета изменения рейтингов К=10х(Р—Б) число 10 заменяется на 10/n(n— максимальное число партий, сыгранное кем-либо в турнире (матче)). Заметим, что с этой проблемой борются в ФШР, но уж очень оригинальным способом. Чтобы рейтинг не рос слишком быстро у «излишне активных» шашистов, изменение рейтинга в течение полугода домножается на 40/n, где n— число сыгранных партий (если n>40). Но ведь виновата не активность шашиста, которую нужно всячески приветствовать, а несовершенство системы подсчета рейтингов. Рейтинги с помощью программы В. Шулюпова подсчитываются с точностью до 0,1» (Степанчук Н. Шашки. Украина, 2004).
«Один из недостатков системы Эло связан с возникновением в ней некоторых парадоксов. Пусть, например, двое играют матч без ограничения числа партий. Причем один набирает чуть больший процент очков, чем “положено” по Эло, а другой — чуть меньший. Тогда рейтинг первого неограниченно растет, а рейтинг второго неограниченно падает. Если бы пересчет рейтингов производился после каждой партии, то в нашем примере они быстро стабилизировались бы и ничего парадоксального не произошло. Разумеется, такой частый пересчет рейтинга малоудобен. Впрочем, если число партий в матче или турнире не превосходит 20— 25 (а практически больше и не бывает), то никаких недоразумений не случится» (Гик Е.Я., 1976).
«Мне пришлось рассчитывать рейтинги команд — участников чемпионата мира по футболу с 1936 по 1996 год. Наибольший казус случился при расчете за 1982 год. Тогда сборная Италии играла в одной предварительной группе с Камеруном. Как известно, итальянцы безобразно плохо играют предварительные игры, много отсиживаются в обороне, играют по принципу минимальных затрат сил на предварительные встречи. Две игры они сыграли 0:0 и 1:1. Личную встречу со сборной Камеруна они сыграли 1:1. Сборная Камеруна две другие встречи в группе сыграла вообще 0:0. Естественно, эти счета равносильны тому, что Камерун и вовсе не играл ни с кем, кроме сборной Италии. А поскольку они сыграли 1:1, то сборная Камеруна была обречена иметь тот же рейтинг, что и сборная Италии. А они в тот год, как известно, стали чемпионами мира. Вот и случилось чудо — первое место в моих подсчетах за 1982 год «поделили» сборные Италии и Камеруна» (Полозов А.А., 2004).
«Часто наблюдается простое дублирование параметров игровой деятельности. Например, если учесть разность забитых и пропущенных мячей и еще набранные очки — это равносильно тому, что учесть две взаимосвязанные характеристики. При этом линейное уравнение в неявном виде становится нелинейным полиномиальным. Это может приводить к искажениям в итоговых результатах. Однако новые коэффициенты не в силах изменить нелинейность, и, как следствие, такие случаи явного несоответствия не прекращаются. В итоге смена коэффициентов неизбежно превращается в постоянный процесс. А далее возникает вопрос о необходимости выделения независимых параметров в “формуле успеха” и способе определения фактических коэффициентов, то есть такие неофициальные классификации можно рассматривать в качестве временной компенсации отсутствующей официальной» (Полозов А.А., 2000).
ПОДВЕДЕМ ИТОГИ
Все парадоксы пересчета рейтинга могут быть связаны с нелепостью самой ситуации, неадекватностью использования в формуле фиксированных коэффициентов и выходом за рамки соответствующей системы линейных уравнений. Именно произвольность в организации и пересчете приводит к потере корректного решения. В тех случаях, когда нет такой потери, решения получаются всегда и без проблем.
1.4.21. Возможна ли компенсация фактора возраста?
Да, это возможно
«Для мужчин и женщин от 35 лет и моложе 20 лет полученный результат делится на возрастной коэффициент согласно таблице “Возрастные коэффициенты”. (Возраст определяется как число полных лет на дату старта)» (Бег. Положение, 2004).
1.4.22. Нужно ли карать участника снижением рейтинга за пропуск очередных соревнований?
Да, необходимо
«Неучастие спортсмена в соревновании приводит к понижению рейтинга на 6 пунктов в конкурсе и на 12 в выездке» (Чебышев Н., 2004, Конный спорт).
«Рейтинг Текущий определяется как Рейтинг Последний, уменьшенный на количество дней, прошедших по истечении одного года после даты последних соревнований, в которых участвовал игрок, до даты определения рейтинг-листа. В случае если спортсмен не принимает участия в обсчитываемых соревнованиях в течение года, его рейтинг ежедневно уменьшается на 1. Именно это, «оштрафованное» значение используется во всех целях» (Настольный теннис. Положение, 2004).
Нет, если он выполнил минимальную норму игр за год
«Минимальное число матчей макротурнира для данного участника определяется равенством общего числа участников макротурнира числу 2 в степени от числа официальных встреч данного участника. Если этот рубеж пройден, то участник точно попадает в итоговый рейтинг-лист календарного года. Если нет, то не попадает, а его результаты аннулируются. Любое число снятых пунктов рейтинга является произволом и неизбежно приводит к сползанию среднего рейтинга макротурнира» (Полозов А.А., 2004).
1.4.23. Должна ли быть связь между разрядами, званиями и рейтингом?
Не обязательно
(Эло А., 1963).
Да, это необходимо
«В настоящее время ЕВСК 2001—2005 вступило в силу и действует на всей территории Российской Федерации. Для выполнения разрядов требуется достичь значения рейтинга: КМС = 700, 1-й разряд = 500, 2-й разряд = 400, 3-й разряд = 300, 1-й юношеский разряд = 200, 2-й юношеский разряд = 100, 3-й юношеский разряд = 1. Для присвоения КМС спорткомитетом субъекта РФ 1-го разряда и ниже организацией, имеющей на это право, предоставленное спорткомитетом субъекта РФ, достаточным является соответствующее представление (подтверждение) достижения необходимого значения рейтинга секретарем ФНТР в субъекте РФ. Всякая иная схема присвоения спортивного разряда является незаконной и может преследоваться» (Настольный теннис. Положение, 2004).
1.4.24. Если считать рейтингом произведение параметров всех аспектов соревнований, то какие из них чаще всего входят в это произведение как сомножители?
Ранг соревнований, коэффициент команды. (Пейнтбол. Положение, 2004).
Ранг соревнований, бонусные очки, очки за место. (O’Neill Rankings/огOlympic Classes, ИСАФ, Парусныйспорт, 2003).
Ранг соревнований, занятое место. (Ледолазание. Положение, 2001).
Длина дистанции, время участника, коэффициент местности, коэффициент возраста участников. (Красильников Б., Ориентирование, 2003).
Число высококвалифицированных участников, очки за место, сумма зачетных упражнений. (Планерный спорт. Положение, 1997).
Число игроков, цена тура, доля положительных вистов участника. (Пушков С., Преферанс, 2004).
Занятые места. (Скалолазание. Положение, 2004).
Занятое место, ранг турнира, формула соревнований, число участников основного турнира. (Теннис. Украина. Положение, 2001).
Уровень турнира, бонус за разность, фактор поля, набранные очки. (Божков А.В., 2004).
1.4.25. Что автор классификации должен представить общественности в первую очередь — формулы расчета или принципы расчета?
Формулы расчета
Подавляющее большинство классификаций.
Принципы расчета
«Все классификации в той или иной мере должны быть основаны на принципах транзитивности и асимптотической устойчивости» (Садовский А.Л., Садовский Л.Е., 1986).
«Основной сложностью в восприятии рейтинг-систем является то, что их авторы предлагают нам, читателям, самим выделить, выковырять из их формул скрытый в них принцип. Нужно все время отгадывать какой-то кроссворд. Именно поэтому не получается нормальной дискуссии. Но это даже не самое главное. Самое главное состоит в том, что рейтинговая классификация — это официально используемый инструмент, который должен быть представлен общественности, и она с его положениями должна согласиться. В основе любой классификации стоят принципы, которые всеми нормально воспринимаются. А уже потом, после их одобрения, для реализации оформленных принципов любой студент сможет предложить подобающую им формулу. Незрелость системы рейтинга проявляется в первую очередь в том, что нет определения понятия “рейтинг” и нет принципов реализации этого определения» (Полозов А.А., 2003).
1.4.26. Как связаны между собой рейтинги участников и результат их личной встречи?
Отношения рейтингов равны отношению набранных и потерянных очков.
«Отношение рейтингов двух соперников равно отношению вероятностей их выигрыша друг у друга» (Мальковский Д.Г., 1993).
«Количество очков M, получаемых теннисистом за отдельный матч, определяется соотношением рейтингов двух теннисистов, участвующих в матче» (Божков А.В., 2004).
«В случае противоборства двух участников естественно принять определение рейтингов участников как отношение числа их побед и поражений» (Потемкин Е.Л., 2004).
Соотношение набранных (M) и потерянных (N) очков находится в степенной зависимости от разности в рейтингах соперников.
«А. Эло предполагал, что соотношение набранных (M) и потерянных (N) очков находится в степенной зависимости от разности в рейтингах соперников. В качестве исходного примем предположение, согласно которому отношение m/nсреднего числа побед игрока Uк среднему числу nего поражений в сериях из N встреч с игроком V находится в экспоненциальной зависимости от разности рейтингов игроков Uи V» (Садовский Л.Е, Садовский А.Л., 1986).
Разница в рейтингах равна разности забитых и пропущенных мячей, деленных на их сумму (Полозов А.А., 1995).
1.5. Сходимость модели
Давайте посмотрим на сходимость действующих моделей рейтинга на примере рейтинга FIFA/Соса-Сola. Прошедший в 2004 г. чемпионат Европы по футболу, как и все предыдущие, обозначил большой шлейф вопросов. Самым большим недоразумением этого чемпионата стала оставшаяся за кадром используемая FIFAсистема ранжирования участников. В финале встретились команды, которые в рейтинге FIFAзанимали 22-е (Португалия) и 35-е (Греция) места. После прихода к руководству сборной Г. Ярцева, несмотря на явное усиление игры, наша сборная почему-то не поднялась выше, а, напротив, опустилась по сравнению с концом 2003-го года на 7 позиций. Как же тогда смогла 31-я по силе команда (21-я без неевропейских команд) попасть в число 16 сильнейших сборных? Как известно, жеребьевка чемпионата Европы проводилась в соответствии с распределением команд по «корзинам», состав которых определялся по тому же рейтингу. Можно ли считать нашу группу равной другим группам, если в ней помимо сборной России играли два будущих финалиста и еще третья по силе команда — сборная Испании? Каким образом Чехия, которая обыгрывает Германию вторым составом, тем не менее находится ниже в рейтинге?
Опубликованный впервые в августе 1993 г. Мировой рейтинг FIFA/Соса-Соla являет собой ежемесячный статус-лист всех мировых ныне действующих старших национальных сборных и включает в себя около 180 команд. Имея множество разработанных систем, авторы взяли за прототип систему ранжирования теннисистов. Кстати, с 2000 г. рейтинг АТП изменен. Методика подсчета, подготовленная в Соса-Со1а, вызвала критику со стороны специалистов за многочисленные дефекты. Система состояла из многочисленных заплаток оказавшегося в итоге не нужного теннисистам рейтинга АТП. Например, авторы системы пытались стимулировать результативность коэффициентами, что представляется скорее политическим, чем статистическим решением. Учитываются результаты тренировочных игр, хотя в них тренеры не гонятся за результатом, а просто просматривают ближайший резерв. Теоретически невозможно сравнивать команды, не имеющие официальных встреч между собой. Если четыре года команды из Африки не играют с командами из Европы и Америки, то приводить их в общем списке нет никаких оснований. Предложенная классификация не имела статистического обоснования. По мнению Е. Потемкина, рейтинг FIFA/Соса-Соla примерно то же самое, как если бы организаторы конкурса красоты выбирали победительницу простым взвешиванием.
В том же теннисе классификации меняются часто, но это хорошо. Они ищут такой вариант, при котором в четвертьфиналах в 99% случаях окажутся 8 первых рейтингов турнира. Теннисисты озабочены сходимостью избранной модели. Рейтинг же FIFA/Соса-Со1а в очередной раз дискредитировал себя превосходством нижестоящих по рейтингу оппонентов над вышестоящими. Уровень классификации от дилетантов не соответствует уровню соревнований. Почему за коммерческие интересы FIFA, ее заигрывание с могущественными корпорациями в виде предоставления возможности «порулить» с помощью рейтинга должна отдуваться наша сборная?
Кстати сказать, показатель сходимости модели в теннисе (процент вышедших в четвертьфинал сеяных игроков) не является адекватным показателем. Он в первую очередь зависит от плотности результатов теннисистов. Во всех видах спорта плотность результатов год от года растет. Следовательно, будет расти и масштаб оценки. Это сейчас их интересует только сам факт победы одного теннисиста над другим. Придет время, и они начнут интересоваться счетом игры по партиям. А для большего масштаба шкалы рейтинга придется пересматривать все настройки. Если говорить о сходимости модели, то следует вести речь о среднем проценте отклонения ожидаемого, планируемого результата от фактического. Минимизации этого показателя на уровне выбора вида функции, способа пересчета должны быть посвящены соответствующие исследования.
ПОДВЕДЕМ ИТОГИ
Суть проблемы рейтинга можно было бы существенно упростить. Если исходить из предположения, что рейтинг — это результат участника в глобальном макротурнире, то сразу же возникает проблема. Все со всеми в круг играть не могут. Слишком много участников. Тогда нужна модель рейтинга, которая бы по части результатов макротурнира воспроизвела бы все его результаты. В этом случае возникает сомнение: насколько точно воспроизводится несыгранная часть макротурнира? Можно ли доверять модели, которая приписывает вам поражение там, где вы выиграли? О качестве модели судят по сходимости предполагаемых и фактических результатов. Тогда, исходя из счета игры, можно рассчитать фактический рейтинг и сравнить его с номинально предписываемым. Или же, что то же самое, сравнить разницу в рейтингах по фактическому исходу личной встречи с разницей номинальных рейтингов. Участника макротурнира интересует та система рейтинга, которая оценивает его с максимальной точностью или, иначе говоря, с минимальной погрешностью.
Все могут согласиться, что расчет своего рейтинга не так прост, как кажется на первый взгляд, но, скажу Вам по секрету, он и не так сложен.
20 октября 2010 года на сайте tt-energy.com вышла замечательная статья «Считаем рейтинг сами или зачем на соревнованиях ручка и тетрадь». Эта статья в полной мере описывает, как самостоятельно рассчитывать свой рейтинг после сыгранных турниров. Также на сайте украинского рейтинга reiting.com.ua есть общая информация о формулах, которые используются в расчете украинского рейтинга. Следуя этим инструкциям несложно рассчитать свой рейтинг. Но есть одно “Но!”, кому захочется что-то считать после проведенного турнира, когда хочется лечь на кровать и задрать ноги повыше? Именно для таких спортсменов (и вообще для всех желающих) я создал простой инструмент – «Калькулятор рейтинга». Далее я расскажу, как им пользоваться.
В первую очередь перейдите на страницу «Калькулятора рейтинга» – http://reiting.scyalta.org/
В верхней части страницы Вам требуется вести несколько обязательных полей:
1. Ваше имя (для наглядности);
2. Ваш рейтинг и вес до начала турнира (если это первый для Вас турнир после выпуска нового рейтинга то смотрим здесь – reiting.com.ua)
Причем нужно брать именно “Рейтинг” – Р, а не “Рейтинг со штрафом”, который обозначается как Рш), например У одного из игроков Р равен 79,8, но из-за маленького веса (В=1) рейтинг со штрафом Рш равен 68,8:
3. Коэффициент турнира, его можно узнать в этой таблице:
Ранг соревнования | Коэффициент |
Личный чемпионат Украины, Супер-лига, Турнир сильнейших игроков (взрослые), Кубок Украины | 1,6 |
Молодежные игры, Турнир сильнейших игроков (юниоры) | 1,4 |
Высшая лига, Региональная лига, Первенство Украины (кадеты, юноши), Юношеские игры, Турнир сильнейших игроков (кадеты), Турниры ФНТУ | 1,2 |
Остальные турниры | 1,0 |
4. Количество Ваших соперников (если меньше 10, то можете не изменять это поле; если больше 10 – введите нужное значение и нажмите кнопку “Рассчитать”, которая находится в нижней части страницы, чтобы увеличить кол-во полей для Ваших соперников);
5. Данные Ваших игр:
5.1. Фамилию соперника (если Вы хотите быстро рассчитать рейтинг и убежать дальше по своим делам, то можете это поле не заполнять, но для удобства и исключения ошибок советую его заполнить);
5.2. Рейтинг Вашего соперника (может быть в далеком будущем рейтинг будет появляться сам, но пока придется вводить значение самому (см. reiting.com.ua), причем, как и со своим рейтингом, нужно указывать “Рейтинг” – Р, а не “Рейтинг со штрафом” – Рш);
5.3. Результат игры (“Победа” / “Поражение”, если оставить это поле нетронутым, то данная игра в расчет браться не будет);
6. И самое главное – нажмите на кнопку “Рассчитать”.
Несколько тонкостей расчета рейтинга:
– Если у Вас до начала турнира не было рейтинга, то запишите Ваш рейтинг и вес равными нулю – «Калькулятор» сам рассчитает Ваш рейтинг;
– Если Вы играли с соперником, у которого нет рейтинга, но на турнире он выиграл рейтингованного игрока, то у него при расчете Вашего рейтинга будет некоторый рейтинг, который можно заранее рассчитать на «Калькуляторе». Цитата из статьи «Считаем рейтинг сами или зачем на соревнованиях ручка и тетрадь»:
Если спортсмен не имел до соревнований рейтинга и выиграл хоть у одного спортсмена, имеющего рейтинг, то для расчета берется опорный рейтинг и вес, равный 0. Опорный рейтинг равен наименьшему из рейтинга спортсменов, которым проиграны встречи но не более наибольшего из рейтинга побежденных спортсменов.
Единственное, что можно добавить – это то, что если Игрок1 (без рейтинга) выиграл у Игрока2 (тоже без рейтинга), причем Игрок1 не выиграл ни одного спортсмена с рейтингом, а Игрок2 выиграл у Игрока3 (с рейтингом), то при расчетах текущего турнира и у Игрока1, и у Игрока2 будет некоторый опорный рейтинг;
– Если после расчета Ваш рейтинг (со штрафом) оказался меньше 10 – то Вы исключаетесь из списка рейтингованных игроков. Цитата из «Правил расчета рейтинга в настольном теннисе»:
Рейтинг со штрафом ( Рш ) – используется для расстановки в начале соревнований. При весе >= 12, совпадает с рейтингом, при весе меньше 12, Рш = Р – 12 + В. Рейтинг со штрафом берется для посева игроков перед началом соревнований. Для попадания в украинский рейтинг спортсмену достаточно выиграть у одного спортсмена, имеющего рейтинг, и к концу соревнований иметь рейтинг со штрафом не меньше 10. Спортсмен исключается из системы рейтинга, при весе 0 или при рейтинге со штрафом меньше 10.
– Если «Калькулятор», на Ваш взгляд, показывает неправильный результат не спешите кричать и плеваться в адрес автора «Калькулятора», для начала попробуйте найти возможную ошибку, которую Вы могли совершить при вводе исходных данных; если и это не помогло, тогда обратитесь ко мне по адресу mail@scyalta.org. Возможно, в «Калькуляторе» действительно есть какая-то ошибка, и именно Вы поможете ее исправить. Также прошу обращаться при интересных идеях усовершенствования «Калькулятора».
A Спортивная рейтинговая система – это система, которая анализирует результаты спортивных соревнований для предоставления оценок для каждая команда или игрок. Общие системы включают опросы экспертов-избирателей, краудсорсинг, неспециалистов, рынки ставок и компьютерные системы. Рейтинги, или рейтинги силы, представляют собой числовые представления о конкурентоспособности, часто напрямую сопоставимые, так что можно предсказать исход игры между любыми двумя командами. Рейтинги или рейтинги силы могут быть предоставлены напрямую (например, путем запроса людей на ранжирование команд) или могут быть получены путем сортировки рейтингов каждой команды и присвоения порядкового номера ранг каждой команды, так что команда с наивысшим рейтингом получает ранг №1. Рейтинговые системы представляют собой альтернативу традиционным видам спорта турнирной таблице, основанной на соотношении побед и поражений.
Футболисты колледжей в Соединенных Штатах
В Соединенных Штатах наиболее широко используются системы спортивных рейтингов для оценки NCAA команд колледжа по футболу в Дивизион I FBS, выбирая команды для участия в плей-офф колледжа футбола. Системы спортивных рейтингов также используются для определения поля для турниров NCAA по мужскому и женскому баскетболу, мужских профессиональных турниров гольф, профессиональных теннисных турниров и НАСКАР. Они часто упоминаются в обсуждениях о командах, которые могут или должны получать приглашения для участия в определенных соревнованиях, несмотря на то, что не имеют прямого доступа (например, чемпионат лиги).
Компьютерные рейтинговые системы могут иметь тенденцию к объективность, без предвзятого отношения к конкретному игроку, команде, региону или стилю. Кен Мэсси пишет, что преимущество компьютерных рейтинговых систем состоит в том, что они могут «объективно отслеживать все» 351 студенческую баскетбольную команду, в то время как опросы людей «имеют ограниченную ценность». Компьютерные рейтинги поддаются проверке, воспроизводятся и являются исчерпывающими и требуют оценки всех выбранных критериев. Для сравнения: рейтинговые системы, основанные на опросах людей, включают в себя врожденную человеческую субъективность; это может быть или не быть привлекательным свойством в зависимости от потребностей системы.
Содержание
- 1 История
- 2 Теория
- 3 Оценка рейтингов
- 3.1 Преимущество хозяев
- 3.2 Сила графика
- 3.3 Очки против побед
- 3.4 Информация в игре
- 3.5 Состав команды
- 3.6 Холодный старт
- 4 Рейтинговые методы
- 4.1 Перестановка позиций
- 4.1.1 Пифагорейцы
- 4.2 Торговля «очками навыков»
- 4.3 Решение уравнений
- 4.1 Перестановка позиций
- 5 Список спортивных рейтинговых систем
- 5.1 Компьютерные рейтинговые системы серии чемпионатов по кубку
- 6 Дополнительная литература
- 6.1 Библиография
- 6.2 Популярная пресса
- 6.3 Учебная работа
- 7 Ссылки
История
Спортивные рейтинговые системы существуют уже почти 80 лет, когда рейтинги рассчитывались на бумаге, а не с помощью компьютера, как большинство из них сегодня. Некоторые старые компьютерные системы, которые все еще используются сегодня, включают: системы Джеффа Сагарина, систему New York Times и Dunkel Index, который восходит к 1929 году. С приходом плей-офф в колледже по футболу участники игры чемпионата Bowl Championship Series были определены путем сочетания экспертных опросов и компьютерных систем.
Теория
Спортивные рейтинговые системы используют различные методы для оценки команд, но наиболее распространенный метод называется рейтингом мощности. Рейтинг силы команды – это расчет силы команды по сравнению с другими командами той же лиги или дивизиона. Основная идея состоит в том, чтобы максимизировать количество транзитивных отношений в заданном наборе данных из-за результатов игры. Например, если A побеждает B, а B побеждает C, то можно с уверенностью сказать, что A>B>C.
Существуют очевидные проблемы с построением системы исключительно на выигрышах и проигрышах. Например, если C побеждает A, тогда устанавливается непереходное отношение (A>B>C>A), и произойдет нарушение ранжирования, если это единственные доступные данные. Подобные сценарии довольно часто случаются в спорте – например, в футбольном сезоне 2005 NCAA Division IA Penn State превзошли Ohio State, Ohio State превзошли Мичиган, а Мичиган обыграл Пенсильванский штат. Чтобы устранить эти логические разбивки, рейтинговые системы обычно учитывают другие критерии, такие как счет игры и место проведения матча (например, для оценки преимущества домашнего поля ). Однако в большинстве случаев каждая команда играет достаточное количество других игр в течение данного сезона, что снижает общий эффект таких нарушений.
С академической точки зрения, использование линейной алгебры и статистики популярно среди многих авторов систем для определения их оценок. Некоторые научные работы публикуются на форумах, таких как MIT Sloan Sports Analytics Conference, другие – в традиционных журналах по статистике, математике, психологии и информатике.
Если не будет достигнута достаточная «меж дивизионная» игра в лиге, команды в изолированном дивизионе могут быть искусственно повышены или понижены в общих рейтингах из-за отсутствия корреляции с другими командами в общей лиге. Этот феномен очевиден в системах, которые анализируют исторические сезоны футбола в колледжах, например, когда лучшие команды Лиги плюща 1970-х годов, такие как Дартмут, были рассчитаны некоторыми рейтинговыми системами для сопоставления с опытные коллективы той эпохи, такие как Небраска, USC и Штат Огайо. Это противоречит субъективному мнению о том, что, хотя они и хороши сами по себе, они были далеко не так хороши, как эти лучшие программы. Тем не менее, это может считаться «профи» не-BCS командами из дивизиона I-A по студенческому футболу, которые указывают, что рейтинговые системы доказали, что их лучшие команды принадлежат к тем же слоям, что и команды BCS. Об этом свидетельствует команда 2004 года Юта, которая не проиграла в регулярном сезоне и заработала заявку на кубок BCS из-за повышения своих общих рейтингов BCS через компонент компьютерных рейтингов. Они продолжили играть и победили чемпиона Big East Conference Питтсбург в 2005 Fiesta Bowl со счетом 35-7. Связанный пример произошел во время мужского баскетбольного турнира NCAA 2006 года, где Джордж Мейсон получил заявку на участие в общем турнире из-за своего рекорда в регулярном сезоне и их рейтинга RPI и использовали эту возможность до Финала четырех.
. Цели некоторых рейтинговых систем отличаются друг от друга. Например, системы могут быть созданы для обеспечения совершенного ретродиктивного анализа игр, в которые играют на сегодняшний день, в то время как другие являются прогностическими и придают большее значение будущим тенденциям, а не прошлым результатам. Это приводит к возможности неверной интерпретации результатов рейтинговой системы людьми, незнакомыми с этими целями; например, рейтинговая система, разработанная для предоставления точных прогнозов разброса очков для игроков, может быть неподходящей для использования при выборе команд, наиболее достойных участия в игре или турнире чемпионата.
Оценка рейтинга
Преимущество дома
Болельщики сборной Франции по баскетболу
Когда две команды одинакового качества играют, команда дома имеет тенденцию побеждать чаще. Размер эффекта меняется в зависимости от эпохи игры, типа игры, продолжительности сезона, вида спорта, даже количества пересеченных часовых поясов. Но при любых условиях «простая игра дома увеличивает шансы на победу». Таким образом, победа вдали от дома считается более предпочтительной, чем домашняя победа, потому что она была более сложной. Преимущество домашнего поля (которое в спорте, играемом на поле, почти всегда называется «преимуществом домашнего поля») также основывается на качествах отдельного стадиона и толпы; Преимущество в НФЛ может составлять более чем 4-х балльную разницу со стадионом с наименьшим преимуществом по сравнению со стадионом с наибольшим преимуществом.
Сила расписания
Сила расписания относится к качеству соперников команды. Победа над более слабым оппонентом обычно воспринимается менее благоприятно, чем победа над более сильным оппонентом. Часто команды одной лиги, которые сравниваются друг с другом при рассмотрении вопроса о чемпионате или плей-офф, не играли с одними и теми же соперниками. Следовательно, судить об их относительном количестве побед и поражений сложно.
Мы не ограничивались записью. Комитет придает большое значение качеству побед штата Орегон.
— Плей-офф колледжа председатель комитета Джефф Лонг, пресс-конференция, 12-я неделя сезона 2014 года, после того как Орегон поставил 9–1 выше 9– 0 Штат Флорида
Комитет плей-офф колледжа по футболу использует алгоритм с ограниченной силой расписания, который учитывает только рекорды оппонентов и рекорды оппонентов (очень похоже на RPI ).
Очки против побед
Ключевое различие между спортивными рейтинговыми системами заключается в представлении результатов игр. Некоторые системы хранят окончательные результаты как троичные дискретные события: победы, ничьи и поражения. Другие системы записывают точный окончательный счет игры, а затем судят команды на основе разницы в победе. Рейтинг команд, основанный на разнице в победе, часто критикуется как побуждающий тренеров увеличивать счет, что является «неспортивным» результатом.
Другие системы выбирают золотую середину, снижая предельное значение дополнительных очков по мере увеличения запаса победы. Сагарин решил ограничить предел победы заранее определенной суммой. Другие подходы включают использование функции спада, такой как логарифм или размещение на кумулятивной функции распределения.
внутриигровая информация
Помимо очков или побед, некоторая система дизайнеры предпочитают включать более подробную информацию об игре. Примеры включают время владения мячом, индивидуальную статистику и смену лидерства. Данные о погоде, травмах или «выбрасываемых» играх в конце сезона могут повлиять на результаты игр, но их трудно смоделировать. «Игры на выбрасывание» – это игры, в которых команды уже заработали слоты в плей-офф и обеспечили свой посев в плей-офф до конца регулярного сезона и хотят дать отдых / защиту своим стартовым игрокам, отправив их на скамейку запасных на оставшиеся игры регулярного сезона. Обычно это приводит к непредсказуемым результатам и может исказить результаты рейтинговых систем.
Состав команды
Команды часто меняют свой состав между играми и внутри игр, и игроки обычно получают травмы. Рейтинг команды часто связан с рейтингом конкретной группы игроков. Некоторые системы предполагают паритет среди всех членов лиги, например, каждая команда создается из равноправного пула игроков с помощью системы драфта или системы свободного агентства как есть сделано во многих видах спорта высших лиг, таких как NFL, MLB, NBA и NHL. Это, конечно, не относится к университетским лигам, таким как футбольный дивизион I-A или мужской и женский баскетбол.
Холодный старт
В начале сезона не было игр, по которым можно было бы судить об относительном качестве команд. Решения проблемы холодного старта часто включают некоторые показатели предыдущего сезона, возможно, взвешенные по тому, какой процент команды возвращается в новый сезон. Рейтинги мощности ARGH – это пример системы, которая использует несколько предыдущих лет плюс процентный вес вернувшихся игроков.
Методы оценки
Этот список, связанный со спортом, неполный ; вы можете помочь.
Перестановка позиций
Некоторые методы предлагают некоторую перестановку традиционных позиций. Этот поиск «реальной» записи о победах и поражениях часто включает использование других данных, таких как разница в очках или личности оппонентов, чтобы изменить отчет команды таким образом, чтобы это было легко понять. Спортивный обозреватель Грегг Истербрук создал систему Authentic Games, которая учитывает только игры, сыгранные против оппонентов, которые считаются достаточно качественными. По общему мнению, не все победы равны.
Я просмотрел первые несколько недель игр и переделал все записи, отмечая каждую игру либо как законную победу или поражение, либо как выдающуюся победу или поражение, либо как игру или / или. И если что-нибудь еще произошло в той игре, имеющей последствия для азартных игр – возвращение выигрыша, раздутое преимущество, серьезная дисфункция, что угодно – я тоже отметил это.
— Билл Симмонс, спортивный обозреватель, Грантленд
пифагорейец
Пифагорейское ожидание или проекция Пифагора вычисляет процентное соотношение, основанное на количестве очков, набранных и допущенных командой. Обычно формула включает количество набранных баллов, возведенное в степень, указанное в числителе. Затем количество очков, набранных командой, возведенное в один и тот же показатель, помещается в знаменатель и добавляется к значению в числителе. Футбольные аутсайдеры использовали
- Пифагорейские победы = очки за 2,37 очка за 2,37 + очки против 2,37 × сыгранных игр. { displaystyle { text {Pythagorean wins}} = { frac {{ text {Points For}} ^ {2.37}} {{ text {Points For}} ^ {2.37} + { text {Points Against} } ^ {2.37}}} times { text {Сыгранные игры}}.}
Полученный процент часто сравнивают с истинным процентом побед команды, и сравнивают команду «перевыполненных» или «недостигнутых» к пифагорейскому ожиданию. Например, Билл Барнуэлл подсчитал, что до 9-й недели сезона НФЛ 2014 года Аризонские кардиналы имели рекорд Пифагора на две победы ниже, чем их реальный рекорд. Билл Симмонс цитирует работу Барнвелла перед 10-й неделей того сезона и добавляет, что «ботаник с любыми числами размахивает« РЕГРЕССИЕЙ !!!!! » флаг прямо сейчас “. В этом примере рекорд регулярного сезона «Аризона Кардиналс» был 8-1 на 10-й неделе сезона 2014 года. Пифагорейская формула победы подразумевала процент выигрышей в 57,5%, исходя из 208 набранных и допустимых 183 очков. Пифагорейские ожидания кардиналов, умноженные на 9 сыгранных партий, составили 5,2 победы и 3,8 поражения. На тот момент команда «перевыполнила» 2,8 победы, исходя из фактических 8 побед минус ожидаемые 5,2 победы, что на 0,8 больше, чем неделей ранее.
Обмен «очками навыков»
Первоначально разработанный Арпадом Эло как метод ранжирования шахматистов, несколько человек адаптировали систему рейтинга Эло для командных видов спорта, таких как баскетбол., футбол и американский футбол. Например, Джефф Сагарин и FiveThirtyEight публикуют футбольные рейтинги НФЛ с использованием методов Эло. Рейтинги Эло изначально присваивают значения силы каждой команде, и команды обмениваются очками в зависимости от результата каждой игры.
Решение уравнений
Такие исследователи, как Мэтт Миллс, используют цепи Маркова для моделирования футбольных матчей в колледжах с оценкой силы команд в качестве результатов. Такие алгоритмы, как PageRank Google, также были адаптированы для ранжирования футбольных команд.
Список систем спортивного рейтинга
- Расширенная статистика НФЛ, Соединенные Штаты Америки Национальная футбольная лига
- Рейтинги мощности ARGH
- Рейтинги ATP, международный теннис
- Матрица Колли
- Система Дикинсона, Соединенные Штаты Америки американский футбол
- Баскетбольные рейтинги Pomeroy College, Соединенные Штаты Америки студенческий баскетбол
- индекс процентного соотношения рейтингов (RPI), Соединенные Штаты Америки NCAA баскетбол, бейсбол, софтбол, хоккей, футбол, лакросс и волейбол
- Smithman Qualitative Index, Соединенные Штаты Америки футбол – устаревшее
- Power Ratings Сонни Мура
- TrueSkill, байесовская система рейтинга, созданная на основе рейтинговой системы Glicko
компьютерных рейтинговых систем Bowl Championship Series
В студенческом американском футболе следующие Системы людей использовались для выбора команд для участия в игре национального чемпионата.
Дополнительная литература
Библиографии
Популярная пресса
- Эд Фэн (24 ноября 2014 г.). «Как понять аналитику американского футбола – полное руководство». Ранг силы.
- Мазер, Виктор (23 октября 2012 г.). «Десятки рейтингов колледжей по футболу задают вопрос №1». New York Times.
- Уэйн Уинстон – профессор наук о принятии решений в Университете Индианы и был одноклассником Джеффа Сагарина в Массачусетском технологическом институте. Он опубликовал несколько редакций текста о программе для работы с электронными таблицами Microsoft Excel, которая включает материалы по рейтингу спортивных команд, а также книгу, посвященную непосредственно этой теме. Он и Сагарин вместе создали рейтинговые системы.
Академическая работа
- Барроу, Дэниел; Драйер, Ян; Эллиот, Питер; Гаут, Гаррен; Остинг, Брэкстон (май 2013 г.). «Рейтинги: эмпирическое сравнение предсказательной силы методов спортивного ранжирования». Журнал количественного анализа в спорте. 9 (2). doi : 10.1515 / jqas-2013-0013. ISSN 1559-0410.
- Gray, Kathy L.; Швертман, Нил К. (март 2012 г.). «Сравнение отбора команд и посева для мужского баскетбольного турнира NCAA 2011». Журнал количественного анализа в спорте. 8 (1). DOI : 10.1515 / 1559-0410.1369. ISSN 1559-0410.
- Мэсси, Кен (весна 1997 г.). «Отличный проект по математике» (PDF). доступно на Статистические модели, применяемые к рейтингу спортивных команд в Интернет-архиве PDF
- Миз, Дэвид (2003). «Штрафной подход максимального правдоподобия для ранжирования футбольных команд колледжей независимо от победного поля» (PDF). Американский статистик. 57 (4): 241–248. doi : 10.1198 / 0003130032396.