Dlaczego FIDE nadal używa Elo?


11

Byłem pod wrażeniem sposobu działania systemu klasyfikacji Glicko . W szczególności:

  • więcej gier ostatnio granych powoduje stabilizację Twojej oceny
  • mniej gier ostatnio granych powoduje, że twoja ocena zmienia się, dopóki nie pojawi się kilka ostatnich gier

USCF zmodyfikował swój system, aby był podobny kilka lat temu (tam, gdzie istnieje przesuwna skala, aby wzmocnić lub stłumić zmianę oceny dla danego meczu), a teraz, gdy Glickman (wynalazca Glicko) jest na tablicy ocen dla USCF, Wyobrażam sobie, że ostatecznie przyjmą jeszcze bardziej elastyczny system, taki jak jego własny.

Czy istnieje powód (poza tym, że jest odporny na zmiany lub po prostu jeszcze tego nie zrobił), że FIDE nie przyjmuje bardziej dokładnego systemu oceny?

Odpowiedzi:


9

Nie udowodniono, że Glicko jest dokładniejszy. Glicko po prostu rozwiązuje problem w inny sposób, z innym naciskiem. Weź pod uwagę, że wszystkie te układy abstrakują ludzki umysł do 4 cyfr.

W rankingach jest dużo polityki; to drażliwy temat. Gdyby FIDE je przyjęło, stworzyliby nową listę 100 najlepszych, a wielu GMów byłoby prawdopodobnie zdenerwowanych.

System ELO jest bardzo łatwy do zrozumienia; przejrzystość jest ważna. Bardziej złożone systemy mają bezpośrednie wady.


6
+1, chociaż nie zgadzam się z pierwszym akapitem, reszta jest wystarczająca. 1) Udowodniono, że Glicko jest dokładniejszy średnio (mierzony na podstawie tego, jak często jest w stanie przewidzieć, kto wygra dany mecz). 2) W przypadku abstrakcji ludzkiego umysłu na pewną liczbę, tak nie jest. Jest to miara umiejętności, która umożliwia obliczenie prawdopodobieństwa (wygranej / remisu / porażki) podczas porównywania poziomów umiejętności. Wszystko to jest poparte matematyką i statystykami. W Glicko-2 jest nawet nowy czynnik zmienności, dla tych graczy, którzy grają niekonsekwentnie (pozwalając, aby ich oceny ulegały większym wahaniom).
Eve Freeman

1
Ciekawy. Potwierdziłbym jednak, że „średnio lepiej” niekoniecznie jest „lepsze”. Co zrobić, jeśli czasy, kiedy nie jest dokładniejszy, powodują rzeczywistą szkodę? Przeczytam jednak o tym.
Tony Ennis



7

O ile rozumiem, system oceny Glicko dodaje ocenę wiarygodności do numeru oceny, co może zapewnić większą rzetelność w obliczeniach korekty wyniku oceny. Oczywiście może to prowadzić do błędnego założenia, że ​​istnieje korelacja między graniem w ocenione gry a wynikającą z tego siłą gry (ponieważ brak gry obniża wynik wiarygodności, co z kolei obniża wartość twojego rankingu). Widzę wiele problemów związanych z oceną niezawodności, chociaż muszę przyznać, że nie jestem ekspertem od subtelności systemu. Wystarczy wybrać trzy:

  • Gracz grający tylko w rzadko ocenianą grę może już nie otrzymywać zaproszeń. Wyobraź sobie, że jesteś dyrektorem turnieju zapraszającym atrakcyjnych graczy. Teraz musisz wybrać między 10 graczami, z których każdy ma ten sam numer oceny, ale różne liczby niezawodności. Prawdopodobnie najpierw wybierzesz te o najlepszych numerach niezawodnościowych. Z biegiem czasu różnica w niezawodności między graczami z wieloma ocenionymi grami i mniejszymi może się poszerzyć.
  • Manipulowanie liczbami ratingowymi może stać się łatwiejsze. Nawet system ELO nie jest bezpieczny dla oszustów, ponieważ niektóre osoby otrzymały oceny lub normy IM / GM, grając w sfałszowanych turniejach. Dobry wynik rzetelności może sprawić, że pomoc graczom bez wyniku rzetelności będzie bardzo tania - dobry gracz daje punkty rankingowe, nie tracąc dużo sam. Zaraz po zaangażowaniu pieniędzy ważne jest, aby być bezpiecznym dla oszustów. Mam wrażenie, że system oceny Glicko jest bardziej podatny na manipulacje.
  • Komunikacja i zrozumienie siły gry mogą stać się trudniejsze dla mas. Kiedy przekazujesz listę rankingową, napotykasz problemy. Gracz z oceną 2000-50 ma „prawdziwą siłę gry” gdzieś między 1900 a 2100. Inny gracz ma 1950-2000, co przekłada się na liczbę w przedziale 1750 i 2150. Tak więc gracz z 1950-2000 może być w rzeczywistości lepszym graczem, ale prawdopodobnie zostanie sklasyfikowany poniżej drugiego, tylko dlatego, że grał mniej gier lub przeciwko mniej wiarygodnym przeciwnikom. Utrudniasz wyjaśnianie ludziom swojego systemu rankingowego, nie gwarantując przy tym większej uczciwości. MG, który przestaje grać, może zyskać „potencjalną siłę” i pochwalić się swoim potencjałem mistrza świata, ponieważ jego liczba niezawodności stwarza coraz większe pole do odchyleń (pamiętaj:

Podsumowując: Możesz uzyskać więcej, niż się spodziewałeś, ponieważ cały pakiet zawiera nie tylko ulepszenia. A ponieważ w górnej części list rankingowych występują poważne problemy finansowe, nie widzę zalet zmiany istniejącego systemu.


Większość list rankingowych ma wartość graniczną dla wyniku rzetelności (RD), zamiast próbować wykorzystać ją do uszeregowania graczy. Tak więc 2000 (50) zawsze byłby klasyfikowany wyżej niż 1950 (100). Zgodnie z ich obecną oceną mają wyższą ocenę, niezależnie od niezawodności. Jeśli gracz z 1950 r. (100) wygra z 2000 r. (50), jego ocena wzrośnie znacznie bardziej niż w przypadku 1950 r. (50). Czy możesz bardziej szczegółowo opisać, jak można oszukiwać system za pomocą Glicko? Czy mówisz o worku z piaskiem, jeśli masz wysokie RD?
Eve Freeman

@West Freeman: Wątpię, czy jest to idealne miejsce do udowodnienia względnej skłonności do oceniania systemu oceny i po prostu zgaduję, ponieważ dla mnie tańsze jest manipulowanie systemem, ponieważ nie stracę tylu punktów oceny gdy celowo przegrywam z graczem bez oceny. Ważniejszą kwestią mojej odpowiedzi jest to, że powinieneś sprawdzić system nie tylko pod kątem rzetelności obliczeń, ale także pod względem podatności na zranienie, możliwości komunikacji itp., Zanim wyrzucisz działający system.
Ray

Ale w jaki sposób sztucznie podnosi czyjąś ocenę? Zazwyczaj ludzie próbujący grać w system próbują obniżyć swoją ocenę, aby mogli grać w niższych sekcjach i wygrać pierwszą nagrodę. Może to być łatwiejsze z Glicko, jeśli unikniesz gry przez długi czas, a następnie przegrasz kilka gier, które powinieneś wygrać. Ale w połączeniu z minimalnymi ratingami i faktem, że można to zrobić tylko raz na jakiś czas, ponieważ RD wymaga czasu, aby wrócić.
Eve Freeman

1
Możesz potrzebować wysokich ocen, aby zdobyć tytuł, otrzymać zaproszenia lub zarabiać przez kluby za grę dla nich lub pracę jako trener. Mówię o profesjonalnych szachach tutaj i gdzie są prawdziwe pieniądze, ponieważ kwestionowałeś zachowanie FIDE.
Ray
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.