Biorę udział w kursie Wprowadzenie do Bayesa i mam trudności ze zrozumieniem rozkładów predykcyjnych. Rozumiem, dlaczego są przydatne i znam definicję, ale są pewne rzeczy, których nie do końca rozumiem.
1) Jak uzyskać właściwy rozkład predykcyjny dla wektora nowych obserwacji
Załóżmy, że zbudowaliśmy model próbkowania dla danych i wcześniejszego . Zakładamy, że obserwacje są warunkowo niezależne podano .
Zaobserwowaliśmy pewne dane i aktualizujemy nasze poprzednie do tylnego .
Gdybyśmy chcieli przewidzieć wektor nowych obserwacji , I myślę, że powinniśmy spróbować uzyskać przewidywanie z tyłu za pomocą tej formuły co nie jest równe więc przewidywane obserwacje nie są niezależne, prawda?
Powiedz, że Beta ( ) i Dwumianowy ( ) dla stałej . W takim przypadku, jeśli chciałbym zasymulować 6 nowych , jeśli dobrze to rozumiem, błędem byłoby symulowanie 6 losowań niezależnie od rozkładu Beta-Dwumianowego, który odpowiada predykcji tylnej dla pojedynczej obserwacji. Czy to jest poprawne? Nie wiem, jak interpretować, że obserwacje nie są marginalnie niezależne i nie jestem pewien, czy dobrze to rozumiem.
Symulowanie z późniejszych predykcji
Wiele razy, gdy symulujemy dane z predykcji tylnej, stosujemy ten schemat:
Dla od 1 do :
1) Próbka z .
2) Następnie symuluj nowe dane z .
Nie bardzo wiem, jak udowodnić, że ten schemat działa, choć wygląda intuicyjnie. Czy to też ma nazwę? Próbowałem znaleźć uzasadnienie i wypróbowałem różne nazwiska, ale nie miałem szczęścia.
Dzięki!