Prawdopodobieństwo
Typowe problemy w teorii prawdopodobieństwa odnoszą się do prawdopodobieństwa obserwacji x1,x2,...,xn biorąc pod uwagę określony model i parametry (nazwijmy je θ ). Na przykład prawdopodobieństwo wystąpienia konkretnych sytuacji w grach karcianych lub w kości jest często bardzo proste.
Jednak w wielu praktycznych sytuacjach mamy do czynienia z sytuacją odwrotną ( statystyki wnioskowania ). Czyli: obserwacja x1, x2), . . . , xk podany jest i teraz model jestnieznany, a przynajmniej nie wiemy, pewne parametryθ .
W tego typu problemów, które często odnoszą się do pojęcia zwanego prawdopodobieństwo parametrów, L ( θ ) , co stanowi wskaźnik wierzą w Paramerty θ podano obserwacje x1, x2), . . xk . Ta wartość jest wyrażona jako proporcjonalna do prawdopodobieństwa dla obserwacji x1, x2), . . xk zakładając, że parametr modelu θ byłby hipotetycznie prawdziwy. L (θ, x1, x2), . . xk) Observ obserwacje prawdopodobieństwa x1, x2), . . xk dane θ
Dla danej wartości parametru θ bardziej prawdopodobny pewnej obserwacji x1,x2), . .xn jest (w stosunku do prawdopodobieństwa dla innych wartości parametru), tym bardziej obserwacja obsługuje ten konkretny parametr (lub teorię / hipotezę, która zakłada ten parametr). (Względnie) wysokie prawdopodobieństwo wzmocni nasze przekonania na temat tej wartości parametru (jest o tym więcej filozoficzne do powiedzenia na ten temat).
Prawdopodobieństwo wystąpienia problemu niemieckiego czołgu
Teraz do problemu niemieckiego zbiornika funkcja prawdopodobieństwa dla zbioru próbek x1, x2), . . xk to:
L (θ, x1, x2), . . xk) = Pr ( x1, x2), . . xk, θ ) = { 0( θk)- 1jeśli max ( x1, x2), . . xk) > θjeśli max ( x1, x2), . . xk) ≤ θ ,
To, czy zaobserwujesz próbki {1, 2, 10} czy próbki {8, 9, 10}, nie powinno mieć znaczenia, kiedy próbki zostaną wzięte z równomiernego rozkładu z parametrem θ . Obie próbki są jednakowo prawdopodobne z prawdopodobieństwem ( θ3))- 1i używając idei prawdopodobieństwa, jedna próbka nie mówi więcej o parametrzeθniż druga próbka.
Wysokie wartości {8, 9, 10} mogą sprawić, że pomyślisz / uwierzysz, że θ powinno być wyższe. Ale to tylko wartość {10}, która naprawdę daje ci istotne informacje o prawdopodobieństwie θ (wartość 10 mówi ci, że θ będzie dziesięć lub więcej, pozostałe wartości 8 i 9 nic nie przyczyniają się do tej informacji).
Twierdzenie Fizjona Neymana
To twierdzenie mówi ci, że pewna statystyka T.( x1, x2),…,xk) (tj. Niektóre funkcje obserwacji, takie jak średnia, mediana lub jak w niemieckim problemie ze zbiornikiem maksimum) jest wystarczająca (zawiera wszystkie informacji) kiedy można wyliczyć, w funkcji prawdopodobieństwa, terminy, które są zależne od innych obserwacji x1,x2,…,xk , tak że ten współczynnik nie zależy zarówno od parametru θ i x1,x2,…,xk (i część funkcji prawdopodobieństwa, która wiąże dane z hipotetycznymi wartościami parametrów, zależy tylko od statystyki, ale nie od całości danych / obserwacji).
Problem niemieckiego czołgu jest prosty. Widać powyżej, że całe wyrażenie prawdopodobieństwa powyżej to już zależy tylko od statystycznego max(x1,x2,..xk) i reszta wartości x1, x2), . . xk nie ma znaczenia.
Mała gra jako przykład
Powiedzmy, że gramy następującą grę wielokrotnie: θ sama jest zmienną losową i wyciągnąć z równym prawdopodobieństwem 100 albo 110. Następnie rysujemy próbki x1, x2), . . . , xk .
Chcemy wybrać strategię zgadywania θ , w oparciu o obserwowane x1, x2), . . . , xk która maksymalizuje nasze prawdopodobieństwo prawidłowego odgadnięcia θ .
Właściwą strategią będzie wybranie 100, chyba że jedna z liczb w próbie jest> 100.
Moglibyśmy być kuszeni, aby wybrać wartość parametru 110 już przy wielu z x1, x2), . . . , xk wydają się być wszystkie wysokie wartości blisko stu (ale nikt dokładnie ponad sto), ale to byłoby źle. Prawdopodobieństwo takiej obserwacji będzie większe, gdy prawdziwa wartość parametru wynosi 100 niż gdy wynosi 110. Jeśli więc zgadniemy, w takiej sytuacji 100 jako wartość parametru, wówczas mniej prawdopodobne jest popełnienie błędu (ponieważ sytuacja, w której te wysokie wartości są bliskie setce, ale wciąż poniżej, występuje częściej w przypadku, gdy prawdziwa wartość wynosi 100, niż w przypadku, gdy prawdziwa wartość wynosi 110).