Uwagi ogólne
Aby uczynić odpowiedź udzieloną przez @ Björna nieco bardziej jednoznaczną, a jednocześnie bardziej ogólną, powinniśmy pamiętać, że doszliśmy do twierdzenia Bayesa z
p(θ|X)×p(X)=p(X,θ)=p(X|θ)×p(θ)
⟹p(θ|X)=p(X|θ)×p(θ)p(X) (Bayes Thereom)
gdzie reprezentuje obserwowane dane i nasz nieznany parametr, o którym chcielibyśmy wnioskować probabilistycznie - w przypadku pytania parametrem jest nieznana częstotliwość . Nie martwmy się na razie, czy mówimy o wektorach czy skalarach, aby uprościć to.Xθπ
Marginalizacja w ciągłym przypadku prowadzi do
p(X)=∫+∞−∞p(X,θ)dθ=∫+∞−∞p(X|θ)×p(θ)dθ
gdzie wspólny rozkład jest równy jak widzieliśmy powyżej. Jest to stała, ponieważ po „zintegrowaniu” parametru zależy tylko od stałych warunków .p(X,θ)likelihood×prior
Dlatego możemy przeformułować twierdzenie Bayesa jako
p(θ|X)=Const.×p(X|θ)×p(θ) zConst.=1p(X)=1∫p(X|θ)×p(θ)dθ
i w ten sposób dojść do zwykłej formy proporcjonalności w Bayesa twierdzenia .
Zastosowanie do problemu rękę
Teraz jesteśmy gotowi po prostu podłączyć to, co wiemy, ponieważ w przypadku pytania ma formęlikelihood×prior
p(X,θ)=p(X|θ)×p(θ)=A⋅θa+y−1(1−θ)b+n−y−1=A⋅θa′−1(1−θ)b′−1
gdzie , i gdzie zbiera stałe warunki z prawdopodobieństwa dwumianowego i beta wcześniejszy.a′=a+yb′=b+n−yA=1B(a,b)(ny)
Możemy teraz użyć odpowiedzi udzielonej przez @ Björna, aby stwierdzić, że integruje się ona z funkcją Beta razy zbiór stałych pojęć tak żeB(a′,b′)A
p(X)=A⋅∫10θa′−1(1−θ)b′−1dθ=A⋅B(a′,b′)
⟹p(θ|X)=A⋅θa′−1(1−θ)b′−1A⋅B(a′,b′)=θa′−1(1−θ)b′−1B(a′,b′)
Zauważ, że jakikolwiek stały termin we wspólnej dystrybucji zawsze będzie anulowany, ponieważ pojawi się w nominatorze i mianowniku w tym samym czasie (por. Odpowiedź udzielona przez @jtobin), więc naprawdę nie musimy się tym przejmować.
W ten sposób uznajemy, że nasz rozkład tylny jest w rzeczywistości rozkładem beta, w którym możemy po prostu zaktualizować parametry wcześniejszego i aby dotrzeć do tyłu. Właśnie dlatego dystrybuowana wersja beta nazywana jest koniugatem .a′=a+yb′=b+n−y