Czy algorytmy uczenia maszynowego mogą przewidywać wyniki sportowe lub rozgrywki?


40

Mam wiele zestawów danych NFL, które moim zdaniem mogą być dobrym projektem pobocznym, ale jeszcze nic z nimi nie zrobiłem.

Po wejściu na tę stronę przypomniałem sobie algorytmy uczenia maszynowego i zastanawiam się, jak dobrze potrafią przewidywać wyniki meczów piłkarskich, a nawet następną grę.

Wydaje mi się, że można by zidentyfikować pewne trendy - na 3 pozycji w dół i 1, zespół z silnym teoretycznym cofnięciem powinien mieć tendencję do prowadzenia piłki w takiej sytuacji.

Punktacja może być trudniejsza do przewidzenia, ale zwycięską drużyną może być.

Moje pytanie brzmi, czy są to dobre pytania, które należy zadać algorytmowi uczenia maszynowego. Możliwe, że tysiące osób już tego próbowało, ale natura sportu sprawia, że ​​jest to niewiarygodny temat.

Odpowiedzi:


18

Jest wiele dobrych pytań na temat piłki nożnej (i ogólnie sportu), które byłyby niesamowite, gdybyśmy rzucili się na algorytm i zobaczyli, co się wydarzy. Trudność polega na tym, aby wiedzieć, co wrzucić do algorytmu.

Drużyna z dobrym RB mogłaby po prostu spasować na trzeciej i krótkiej pozycji tylko dlatego, że przeciwnicy prawdopodobnie spodziewaliby się na przykład ucieczki. Tak więc, aby rzeczywiście uzyskać pewne godne wyniki, rozbiję problem na mniejsze części i przeanalizuję je statystycznie, wrzucając je do maszyn.

Istnieje kilka (dobrych) stron internetowych, które próbują zrobić to samo, powinieneś je sprawdzić i użyć wszystkiego, co znaleźli, aby ci pomóc:

A jeśli naprawdę chcesz poznać analizę danych sportowych, zdecydowanie powinieneś sprawdzić filmy z konferencji Sloan Sports Conference . Wiele z nich jest rozpowszechnionych na Youtube.


13

Tak. Dlaczego nie?! Przy tak dużej ilości danych zapisywanych w każdym sporcie w każdej grze, inteligentne wykorzystanie danych może doprowadzić nas do uzyskania ważnych informacji na temat wyników zawodników.

Kilka przykładów:

Tak, tak, analiza statystyczna rekordów graczy może dać nam wgląd w to, którzy gracze będą częściej występować, ale nie którzy . Zatem uczenie maszynowe, bliski kuzyn analizy statystycznej okaże się przełomem.


9

Zdecydowanie mogą. Mogę skierować cię na fajny artykuł . Kiedyś użyłem go do implementacji algorytmu przewidywania wyników ligi piłkarskiej, przede wszystkim w celu uzyskania pewnej wartości w stosunku do bukmacherów.

Ze streszczenia artykułu:

dynamiczny uogólniony Bayesowski model do oszacowania umiejętności wszystkich drużyn w lidze zależnych od czasu i do przewidywania meczów piłki nożnej w następny weekend.

Słowa kluczowe:

Modele dynamiczne, uogólnione modele liniowe, modele graficzne, metody Monte Carlo z łańcuchem Markowa, przewidywanie meczów piłki nożnej

Cytat:

Rue, Havard i Oyvind Salvesen. „Prognozy i analiza retrospektywna meczów piłki nożnej w lidze”. Journal of Royal Statistics Society: Series D (The Statistician) 49.3 (2000): 399-418.


7

Uczenie maszynowe i techniki statystyczne mogą poprawić prognozę, ale nikt nie jest w stanie przewidzieć prawdziwego wyniku.

Kilka miesięcy temu odbyły się zawody o przepowiadanie turnieju NCAA 2014 . Możesz przeczytać Forum Konkursów, aby uzyskać lepszy pomysł na to, co ludzie zrobili i jakie wyniki osiągnęli.


7

Wykazano wcześniej, że techniki uczenia maszynowego mogą być stosowane do przewidywania wyników sportowych. Proste wyszukiwanie w Google powinno dać ci mnóstwo wyników.

Jednak wykazano również (dla NFL btw), że bardzo złożone modele predykcyjne, proste modele predykcyjne, pytania ludzi lub wiedza tłumu poprzez wykorzystanie informacji o zakładach, wszystkie działają mniej więcej tak samo. Źródło: „ Wszystko jest oczywiste, gdy poznasz odpowiedź - jak zdrowy rozsądek zawodzi ”, rozdział 7, autor: Duncan Watts.


Ciekawy. Powodem, dla którego zadałem to pytanie, jest to, że zastanawiałem się, czy coś podobnego do „błędu hazardzisty” (a nawet samego GF). Pomyślałem, że może istnieć szansa, że ​​już udowodniono, że jest to bezowocne przedsięwzięcie. Nadal - te inne odpowiedzi są intrygujące.
Steve Kallestad,

6

Michael Maouboussin w swojej książce „The Success Equation” przygląda się odróżnianiu szczęścia od umiejętności w różnych przedsięwzięciach, w tym w sporcie. W rzeczywistości klasyfikuje sport według ilości szczęścia, która przyczynia się do wydajności w różnych dyscyplinach sportowych (str. 23), a około 2/3 wydajności w piłce nożnej można przypisać umiejętnościom. Z kolei użyłem techniki MM do analizy osiągów w wyścigach Formuły 1 i odkryłem, że 60% można przypisać umiejętnościom (mniej niż się spodziewałem).

To powiedziawszy, wydaje się, że tego rodzaju analiza sugerowałaby, że wystarczająco szczegółowy i spreparowany zestaw funkcji pozwoliłby algorytmom ML przewidzieć wydajność zespołów NFL, być może nawet na poziomie gry, z zastrzeżeniem, że ze względu na wpływ nadal będzie istniała znacząca wariancja. szczęścia w grze.



5

Przeprowadziłem badania w tej dziedzinie. Odkryłem, że łańcuchy Markowa pierwszego rzędu dobrze sprawdzają się w przewidywaniu dynamiki punktacji w różnych dyscyplinach sportowych.

Możesz przeczytać bardziej szczegółowo tutaj: http://www.epjdatascience.com/content/3/1/4


5

Nie potrafią przewidzieć, ale mogą powiedzieć najbardziej prawdopodobny wynik. Istnieją badania na temat tego rodzaju podejścia z Etienne - Przewidywanie, kto wygra Puchar Świata z językiem Wolfram . Jest to bardzo szczegółowe badanie, dzięki czemu możesz sprawdzić całą metodologię zastosowaną do uzyskania prognoz.

Co ciekawe, 11 z 15 meczów było poprawnych!

Jak można się spodziewać, Brazylia jest faworytem, ​​z prawdopodobieństwem wygranej 42,5%. Ten uderzający wynik wynika z faktu, że Brazylia ma zarówno najwyższy ranking Elo, jak i gra u siebie.

(Chodźmy do Brazylii!)


3

Wiele osób podkreślało, jakie rzeczy można przewidzieć w ich odpowiedziach. Teraz, dzięki fascynacji głębokim uczeniem się, możesz na przykład użyć RNN (powiedzmy LSTM) do przewidywania wyników problemów sportowych opartych na czasie. Są to najnowocześniejsze rozwiązania, które bez problemu pokonują tradycyjne modele.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.