Potrzebujesz modelu prawdopodobieństwa.
Idea systemu rankingowego polega na tym, że pojedyncza liczba odpowiednio charakteryzuje umiejętności gracza. Możemy nazwać ten numer „siłą” (ponieważ „ranga” oznacza już coś konkretnego w statystykach). Przewidujemy, że gracz A pokona gracza B, gdy siła (A) przekroczy siłę (B). Ale to stwierdzenie jest zbyt słabe, ponieważ (a) nie ma charakteru ilościowego i (b) nie uwzględnia możliwości, że słabszy gracz czasami pokonuje silniejszego gracza. Oba problemy możemy pokonać, zakładając, że prawdopodobieństwo, że A pokonuje B, zależy tylko od różnicy w ich sile. Jeśli tak jest, możemy ponownie wyrazić wszystkie mocne strony, aby różnica była równa logarytmowi szans na wygraną.
W szczególności ten model jest
l o g i t (Pr(A bije B))= λZA- λb
gdzie z definicji jest logarytmem szans i napisałem dla siły gracza A itp.λ Al o g i t (p)=log( p ) - log( 1 - p )λZA
Ten model ma tyle parametrów, co graczy (ale jest o jeden stopień mniej swobody, ponieważ może identyfikować tylko siły względne , więc ustalilibyśmy jeden z parametrów o dowolnej wartości). Jest to rodzaj uogólnionego modelu liniowego (w rodzinie dwumianowej z łączem logit).
Parametry można oszacować na podstawie maksymalnego prawdopodobieństwa . Ta sama teoria zapewnia środki do wznoszenia przedziałów ufności wokół oszacowań parametrów i testowania hipotez (takich jak to, czy najsilniejszy gracz, zgodnie z szacunkami, jest znacznie silniejszy niż szacowany najsłabszy gracz).
W szczególności prawdopodobieństwem zestawu gier jest produkt
∏wszystkie gryexp( λzwycięzca- λprzegrany)1 + exp(λzwycięzca-λprzegrany).
Po ustaleniu wartości jednego z , szacunki pozostałych są wartościami, które maksymalizują to prawdopodobieństwo. Tak więc zmiana któregokolwiek z oszacowań zmniejsza prawdopodobieństwo od jego maksimum. Jeśli zostanie zbytnio zredukowane, nie będzie zgodne z danymi. W ten sposób możemy znaleźć przedziały ufności dla wszystkich parametrów: są to granice, w których zmienianie oszacowań nie nadmiernie zmniejsza prawdopodobieństwo dziennika. Podobnie można przetestować ogólne hipotezy: hipoteza ogranicza mocne strony (np. Zakładając, że wszystkie są równe), to ograniczenie ogranicza, jak duże może być prawdopodobieństwo, a jeśli to ograniczone maksimum jest zbyt dalekie od rzeczywistego maksimum, hipoteza jest odrzuconeλ
W tym konkretnym problemie jest 18 gier i 7 darmowych parametrów. Ogólnie jest to zbyt wiele parametrów: istnieje tak duża elastyczność, że parametry można dowolnie zmieniać bez znacznej zmiany maksymalnego prawdopodobieństwa. Zatem zastosowanie maszyny ML może okazać się oczywiste, a mianowicie, że prawdopodobnie nie ma wystarczających danych, aby mieć pewność co do szacunków siły.