Płaski, koniugatowy i hiper-priory. Czym oni są?


15

Obecnie czytam o Bayesian Methods in Computation Molecular Evolution autorstwa Yang. W rozdziale 5.2 mówi o priory, a konkretnie nieinformacyjne / płaskie / niejasne / rozproszone, sprzężone i hiper-priory.

Może to wymagać uproszczenia, ale czy ktoś mógłby wyjaśnić po prostu różnicę między tego rodzaju priorytetami i jak to wpływa na wynik analizy / decyzji, które podejmowałbym w trakcie analizy bayesowskiej?

(Nie jestem statystykiem i dopiero zaczynam naukę analiz bayesowskich, więc im bardziej laik, tym lepiej)

Odpowiedzi:


15

Mówiąc najprościej, przełożony płaski / nieinformacyjny jest stosowany, gdy ktoś ma niewielką / żadną wiedzę na temat danych, a zatem ma najmniejszy wpływ na wyniki analizy (tj. Wnioskowanie z tyłu).

Rozkłady sprzężone to te, których rozkłady wcześniejsze i późniejsze są takie same, a przeor nazywany jest sprzężonym przełożeniem. Jest uprzywilejowany ze względu na jego algebraiczne wygody , szczególnie gdy prawdopodobieństwo ma rozkład w postaci wykładniczej rodziny (Gaussa, Beta itp.). Jest to niezwykle korzystne w przypadku przeprowadzania tylnych symulacji przy użyciu próbkowania Gibbsa.

I wreszcie wyobraź sobie, że wcześniej ustawiona dystrybucja jest ustawiona na parametr w twoim modelu, jednak chcesz dodać kolejny poziom złożoności / niepewności. Narzuciłbyś wtedy wcześniejszą dystrybucję na parametry wspomnianego wcześniej, stąd nazwa hyper -prior.

Myślę, że analiza danych bayesowskich Gelmana to świetny początek dla każdego, kto jest zainteresowany nauką statystyki bayesowskiej :)


1
Po drugie, poparcie dla analizy danych bayesowskich.
Sycorax mówi Przywróć Monikę

14

Na najwyższym poziomie możemy myśleć o wszelkiego rodzaju priorytetach jako o określeniu pewnej ilości informacji, które badacz wnosi do analizy poza danymi: przed spojrzeniem na dane, które wartości parametrów są bardziej prawdopodobne?

W ciemnych czasach analizy bayesowskiej, kiedy Bayesianie walczyli z nią z częstymi, było przekonanie, że badacz chciałby wprowadzić do analizy tak mało informacji, jak to możliwe. Było więc wiele badań i argumentów poświęconych zrozumieniu, w jaki sposób przeor może być w ten sposób „nieinformacyjny”. Dzisiaj Gelman sprzeciwia się automatycznemu wyborowi nieinformacyjnych priorów, mówiąc w Bayesian Data Analysisże opis „nieinformacyjny” odzwierciedla jego stosunek do przeora, a nie jakiekolwiek „specjalne” matematyczne cechy przeora. (Co więcej, we wczesnej literaturze pojawiło się pytanie, w jakiej skali przeor nie ma charakteru informacyjnego. Nie sądzę, że jest to szczególnie ważne w przypadku twojego pytania, ale na dobry przykład tego argumentu z częstej perspektywy patrz początek Gary'ego Kinga, Unifying Political Methodology. )

„Płaski” uprzedni oznacza jednolity uprzedni, w którym wszystkie wartości w zakresie są jednakowo prawdopodobne. Ponownie należy argumentować, czy są one naprawdę nieinformacyjne, ponieważ określenie, że wszystkie wartości są jednakowo prawdopodobne, jest w pewien sposób informacją i może być wrażliwe na sposób parametryzacji modelu. Płaskie priory mają długą historię w analizie bayesowskiej, sięgającą Bayesa i Laplace'a.

„Niejasny” uprzedni jest wysoce rozproszony, choć niekoniecznie płaski, i wyraża, że ​​duży zakres wartości jest prawdopodobny, zamiast koncentrować masę prawdopodobieństwa wokół określonego zakresu. Zasadniczo jest to przeor o dużej wariancji (cokolwiek „duża” wariancja oznacza w twoim kontekście).

Sprzężone priory mają wygodną cechę, która pomnożona przez odpowiednie prawdopodobieństwo, daje wyrażenie w formie zamkniętej. Jednym z przykładów jest wcześniejszy beta z prawdopodobieństwem dwumianowym lub wcześniejszy gamma z prawdopodobieństwem poissona. Pomocne tabele znajdują się w Internecie i Wikipedii. Rodzina wykładnicza jest pod tym względem wyjątkowo wygodna.

Sprzężone priory są często „domyślnym” wyborem dla niektórych problemów ze względu na ich dogodne właściwości, ale to niekoniecznie oznacza, że ​​są one „najlepsze”, chyba że wcześniejsza wiedza może być wyrażona za pomocą wcześniejszego sprzężenia. Postępy w obliczeniach oznaczają, że koniugacja nie jest tak cenna jak kiedyś (por. Próbkowanie Gibbsa vs NUTS), dzięki czemu możemy łatwiej wnioskować z niekoniugowanych priorów bez większych problemów.

N.(μ,σ2))μσ2)μσ2)


1
Ponadto czasami nie jest jasne, co to są „dane”, a co „wcześniejsze informacje”, na przykład spójrz na moją odpowiedź na stats.stackexchange.com/questions/112451/ ...
kjetil b halvorsen
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.