Zastosowanie funkcji gęstości prawdopodobieństwa w obliczeniach. Innymi słowy, jak oceniać takie równania.
Myślę, że nadal myślisz o tym z częstej perspektywy: jeśli szukasz oszacowania punktowego, a posterior nie da ci go. Umieszczasz pliki PDF, wyciągasz pliki PDF. Możesz uzyskać oszacowania punktowe, obliczając statystyki z twojego rozkładu tylnego, ale przejdę do tego za chwilę.
Rozumiem pojęcie priory kontra postwale i rozumiem, jak stosować je przy użyciu stołu ręcznie. Rozumiem (myślę!), Że pi reprezentuje przypuszczalną proporcję populacji lub prawdopodobieństwo.
to to samo, co p ( x ) : oba są plikami PDF. π jest zwyczajowo używany do oznaczenia, że dany plik PDF ma wcześniejszą gęstość.π( x )p (x)π
Podejrzewam, że nie dostaniesz przeorów i osób postronnych tak dobrze, jak ci się wydaje, więc cofnijmy się do fundamentalnej podstawy statystyki bayesowskiej: prawdopodobieństwa subiektywnego .
Eksperyment myślowy z prawdopodobieństwem subiektywnym
Powiedzmy, że prezentuję ci monetę i pytam, czy uważasz, że ta moneta jest uczciwa. Słyszałeś, że wiele osób mówi o nieuczciwych monetach w klasie prawdopodobieństwa, ale tak naprawdę nigdy nie widziałeś jednej w prawdziwym życiu, więc odpowiadasz: „Tak, jasne, myślę, że to uczciwa moneta”. Ale fakt, że zadaję ci to pytanie, trochę cię zniechęca, więc chociaż szacujesz, że to sprawiedliwe, nie byłbyś zaskoczony, gdyby tak nie było. O wiele mniej zaskoczony, niż gdybyś znalazł tę monetę w swojej kieszeni (ponieważ zakładasz, że to cała prawdziwa waluta, a teraz tak naprawdę mi nie ufasz, bo zachowuję się podejrzanie).
Teraz przeprowadzamy kilka eksperymentów. Po 100 rzutach moneta oddaje 53 głów. Jesteś o wiele bardziej pewny, że jest to uczciwa moneta, ale wciąż jesteś otwarty na możliwość, że tak nie jest. Różnica polega na tym, że teraz byłbyś bardzo zaskoczony, gdyby okazało się, że ta moneta ma jakieś nastawienie.
Jak możemy tutaj przedstawić twoje wcześniejsze i późniejsze przekonania, w szczególności w odniesieniu do prawdopodobieństwa, że moneta pokaże głowy (które oznaczymy )? W częstych przypadkach twoje wcześniejsze przekonanie - twoja zerowa hipoteza - wynosi θ = 0,5 . Po uruchomieniu eksperymentu nie możesz odrzucić wartości zerowej, więc kontynuujesz założenie, że tak, moneta jest prawdopodobnie sprawiedliwa. Ale w jaki sposób podsumowujemy zmianę w przekonaniu, że moneta jest uczciwa? Po eksperymencie możesz postawić zakład, że moneta jest uczciwa, ale przed eksperymentem byłbyś przerażony.θθ =0,5
θ = 0,5θ ∼ N( 0,5 , σ2))θ = 0,5θ = 0,5θ = 0,5
Jak wykonujemy obliczenia?
Zaczynamy od plików PDF, a kończymy na plikach PDF. Kiedy musisz zgłosić oszacowanie punktowe, możesz obliczyć statystyki, takie jak średnia, mediana lub tryb rozkładu tylnego (w zależności od funkcji utraty, do której nie będę się teraz zwracał. Pozostańmy przy średniej). Jeśli masz rozwiązanie w postaci zamkniętego formularza dla pliku PDF, określenie tych wartości prawdopodobnie będzie banalne. Jeśli tylny jest skomplikowany, możesz użyć procedur takich jak MCMC, aby pobrać próbki z tylnej i uzyskać statystyki z narysowanej próbki.
W przykładzie, w którym masz wcześniejszą wersję beta i prawdopodobieństwo dwumianowe, obliczenie tylnego zmniejsza się do bardzo czystego obliczenia. Dany:
- θ∼Beta(α,β)
- X|θ∼Binomial(θ)
Następnie tylny zmniejsza się do:
- θ|X∼Beta(α+∑ni=1xi,β+n−∑ni=1xi)
Stanie się tak za każdym razem, gdy będziesz mieć wcześniejszą wersję beta i prawdopodobieństwo dwumianowe, a powód powinien być widoczny w obliczeniach dostarczonych przez DJE . Kiedy określony model prawdopodobieństwa wcześniejszego zawsze daje a posteriorę, która ma taki sam rodzaj rozkładu jak wcześniejszy, związek między rodzajami rozkładów zastosowanych dla wcześniejszego a prawdopodobieństwa nazywa się koniugatem . Istnieje wiele par rozkładów, które mają powiązania sprzężone, a Bayesianie bardzo często wykorzystują sprzężenie w celu uproszczenia obliczeń. Biorąc pod uwagę szczególne prawdopodobieństwo, możesz znacznie ułatwić sobie życie, wybierając wcześniej koniugat (jeśli taki istnieje i możesz uzasadnić swój wybór przeora).
Wierzę, że beta (1,1) odnosi się do pliku PDF, w którym średnia to 1, a stdev to 1?
We wspólnej parametryzacji rozkładu normalnego dwa parametry oznaczają średnią i odchylenie standardowe rozkładu. Ale tak właśnie parametryzujemy rozkład normalny. Inne rozkłady prawdopodobieństwa są parametryzowane bardzo różnie.
Beta(α,β)αβ
XE[X]var[X]∼Beta(α,β)=αα+β=αβ(α+β)2(α+β+1)
Jak wyraźnie widać, średnia i wariancja nie są częścią parametryzacji tego rozkładu, ale mają rozwiązania w formie zamkniętej, które są prostymi funkcjami parametrów wejściowych.
Beta(1,1)Uniform(0,1)