Zasugerowałbym książkę Analiza danych bayesowskich jako świetne źródło odpowiedzi na to pytanie (w szczególności rozdział 6) i wszystko, co zamierzam powiedzieć. Ale jednym ze zwykłych sposobów atakowania tego problemu przez Bayesianów jest użycie posterior Predictive P-values (PPP). Zanim przejdę do sposobu rozwiązania tego problemu przez PPP, pozwól mi najpierw zdefiniować następującą notację:
Niech będą obserwowanymi danymi, a wektorem parametrów. Definiujemy jak replikowane dane, które mogły były obserwowane, albo myśleć wyprzedzająco, jako dane nam będzie zobaczyć jutro, jeśli eksperyment, który produkowany dzisiaj były replikowane z tego samego modelu i to samo wartość która zaobserwowane dane.θ y rep y θyθyrozpustnikyθ
Zauważ, że zdefiniujemy rozkład biorąc pod uwagę obecny stan wiedzy z późniejszym rozkładem predykcyjnym
p ( y rep | y ) = ∫ Θ p ( y rep | θ ) p ( θ | y ) d θyrozpustnik
p ( yrozpustnik| y) = ∫Θp ( yrozpustnik| θ)p(θ | y) dθ
Teraz możemy zmierzyć rozbieżność między modelem a danymi, definiując ilości testowe , aspekty danych, które chcemy sprawdzić. Wielkość testowa lub miara rozbieżności , , to skalarne podsumowanie parametrów i danych, które jest używane jako standard przy porównywaniu danych z symulacjami predykcyjnymi. Ilości testowe odgrywają rolę w modelu Bayesa, sprawdzając, czy statystyki testowe odgrywają w testach klasycznych. Definiujemy zapis dla statystyki testowej, która jest wielkością testową, która zależy tylko od danych; w kontekście bayesowskim możemy uogólnić statystyki testowe, aby umożliwić zależność od parametrów modelu w ich tylnym rozkładzie.T ( y )T.(y, θ )T.( y)
Klasycznie wartość p dla statystyki testowej wynosi
gdzie przyjmuje się prawdopodobieństwo nad rozkładem z naprawionym.p C = Pr ( T ( y rep ) ≥ T ( y ) | θ ) y rep θT.( y)
pdo= Pr ( T( yrozpustnik) ≥ T( y) | θ )
yrozpustnikθ
Z perspektywy bayesowskiej brak dopasowania danych w odniesieniu do tylnego rozkładu predykcyjnego można zmierzyć za pomocą prawdopodobieństwa obszaru ogona lub wartości p wielkości testowej i obliczyć za pomocą symulacji bocznych . W podejściu bayesowskim wielkości testowe mogą być funkcjami nieznanych parametrów, a także danych, ponieważ wielkość testowa jest oceniana na podstawie losowań z rozkładu tylnego nieznanych parametrów.( θ , yrozpustnik)
Teraz możemy zdefiniować bayesowską wartość p (PPP) jako prawdopodobieństwo, że zreplikowane dane mogą być bardziej ekstremalne niż dane obserwowane, mierzone wielkością testową:
gdzie prawdopodobieństwo jest przejmowane przez rozkład tylny i tylny rozkład predykcyjny (że to wspólna dystrybucja, ):
gdzie jest funkcją wskaźnika. W praktyce jednak zwykle obliczamy rozkład predykcyjny boczny za pomocą symulacji.
pb= Pr ( T( yrozpustnik, θ ) ≥ T( y, θ ) | y)
θyrozpustnikp ( θ , yrozpustnik| y)pb= ∬ΘjaT.( yrozpustnik, θ ) ≥ T( y| θ)p ( yrozpustnik| θ)p(θ | y) dyrozpustnikreθ ,
ja
Jeśli mamy już, powiedzmy, symulacje z tylnego rozkładu , możemy po prostu narysować jeden z rozkładu predykcyjnego dla każdego symulowanego ; mamy teraz losowania ze wspólnego rozkładu tylnego, . Tylna kontrola predykcyjna to porównanie zrealizowanych wielkości testowych i predykcyjnych wielkości testowych . Oszacowana wartość p jest tylko proporcją tych symulacji dla których wielkość testowa jest równa lub przekracza wartość zrealizowaną; to znaczy dla któregoθ y rep θ L p ( y rep , θ | y ) T ( y , θ l ) T ( y rep l , θ l ) L T ( y rep l , θ l ) ≥ T ( y , θ l ) l = 1 , . . . , LL.θyrozpustnikθL.p ( yrozpustnik, θ | y)T.( y, θl)T.( yrep l, θl)L.
T.( yrep l, θl) ≥ T( y, θl)
do .
L = 1 , . . . , L
W przeciwieństwie do klasycznego podejścia, sprawdzanie modelu Bayesa nie wymaga specjalnych metod do obsługi „uciążliwych parametrów”. Korzystając z symulacji bocznych, domyślnie uśredniamy wszystkie parametry w modelu.
Dodatkowe źródło, Andrew Gelman, ma również bardzo fajny artykuł na temat PPP tutaj:
http://www.stat.columbia.edu/~gelman/research/unpublished/ppc_understand2.pdf