1. Marginal Prawdopodobieństwo i estymator średniej harmonicznej
Marginalny prawdopodobieństwo jest definiowana jako stałej normalizacji rozkładu a posteriori
p(x)=∫Θp(x|θ)p(θ)dθ.
Znaczenie tej ilości wynika z roli, jaką odgrywa ona w porównywaniu modeli za pomocą czynników Bayesa .
Zaproponowano kilka metod przybliżania tej ilości. Raftery i in. (2007) proponują estymator średniej harmonicznej , który szybko stał się popularny ze względu na swoją prostotę. Pomysł polega na wykorzystaniu relacji
1p ( x )= ∫Θp ( θ | x )p ( x | θ )reθ .
W związku z tym, jeśli mamy próbki z tylnej, powiedzmy , ilość ta może być aproksymowane( θ1, . . . , θN.)
1p( x )≈ 1N.∑j = 1N.1p ( x | θjot).
To przybliżenie jest powiązane z koncepcją próbkowania ważności .
Zgodnie z prawem wielkich liczb, jak omówiono na blogu Neala , mamy, że ten estymator jest spójny . Problem polega na tym, że wymagana dla dobrego przybliżenia może być ogromna. Zobacz kilka przykładów na blogu Neala lub blogu Roberta 1 , 2 , 3 , 4 .N.
Alternatywy
Istnieje wiele alternatyw dla przybliżenia . Chopin i Robert (2008) przedstawiają niektóre metody oparte na próbkowaniu.p ( x )
2. Nie działa wystarczająco długo sampler MCMC (szczególnie w przypadku multimodalności)
Mendoza i Gutierrez-Peña (1999) wydedukowali referencję przed / za dla stosunku dwóch normalnych średnich i przedstawiają przykład wnioskowania uzyskanego z tym modelem przy użyciu prawdziwego zestawu danych. Stosując metody MCMC, uzyskują próbkę o wielkości tylnej proporcji średnich φ, co pokazano poniżej2000φ
φ ( 0,63 ; 5,29 )00
( 0 , 7,25 )
3. Niektóre inne kwestie, takie jak ocena zbieżności, wybór wartości początkowych, złe zachowanie łańcucha, można znaleźć w tej dyskusji Gelman, Carlin i Neal.
4. Ważność próbkowania
sol
ja= ∫fa( x ) dx = ∫fa( x )sol( x )sol( x ) dx .
sol( x1, . . . , xN.)ja
ja≈ 1N.∑j = 1N.fa( xjot)sol( xjot).
solfaN.
# Integrating a Student's t with 1 d.f. using a normal importance function
x1 = rnorm(10000000) # N=10,000,000
mean(dt(x1,df=1)/dnorm(x1))
# Now using a Student's t with 2 d.f. function
x2 = rt(1000,df=2)
mean(dt(x2,df=1)/dt(x2,df=2))