Wybieranie między nieinformacyjnymi wersjami beta


17

Szukam nieinformacyjnych priorytetów dla dystrybucji beta do pracy z procesem dwumianowym (Hit / Miss). Na początku myślałem o użyciu α=1,β=1 które generują jednolity plik PDF, lub Jeffrey przed α=0.5,β=0.5 . Ale tak naprawdę szukam priorów, które mają minimalny wpływ na późniejsze wyniki, a potem pomyślałem o użyciu niewłaściwego przed α=0,β=0 . Problem polega na tym, że moja tylna dystrybucja działa tylko wtedy, gdy mam przynajmniej jedno trafienie i jedno chybienie. Aby temu zaradzić, pomyślałem o użyciu bardzo małej stałej , aby zapewnić, że tylne α i β będą > 0 .α=0.0001,β=0.0001αβ>0

Czy ktoś wie, czy takie podejście jest dopuszczalne? Widzę liczbowe efekty zmiany tych wcześniejszych, ale ktoś mógłby dać mi jakąś interpretację umieszczania małych stałych takich jak ta jako priorytety?


1
W przypadku dużych próbek z dużą ilością trafień i braków nie ma to większego znaczenia. W przypadku małych próbek, zwłaszcza jeśli nie ma co najmniej jednego trafienia i jednego pudła, robi to dużą różnicę; nawet rozmiar „bardzo małej stałej” może mieć znaczący wpływ. Proponuję eksperyment myślowy kluczową dla mógłbyś być, jakiego rodzaju posterior sens po próbki wielkości : to może cię przekonać, że coś takiego jak Jeffrey s przed jest racjonalna1
Henry

I jest artykuł Kerman sugerujący 1/3 i 1/3, b
Björn

Co rozumiesz przez „minimalny wpływ na wyniki późniejsze”? W porównaniu do czego?
Czy

Poprawiłem formatowanie i tytuł twojego pytania, przywróć lub zmień zmiany.
Tim

Odpowiedzi:


33

Przede wszystkim nie ma czegoś takiego jak nieinformacyjny przeor . Poniżej widać rozkłady tylne wynikające z pięciu różnych „nieinformacyjnych” priorów (opisanych poniżej wykresu) podanych różnych danych. Jak wyraźnie widać, wybór „nieinformacyjnych” priorów wpłynął na rozkład tylny, szczególnie w przypadkach, gdy same dane nie dostarczały zbyt wielu informacji .

Tylne ściany z nieinformacyjnych przeorów

α=βα1,β1α=β=1α=β=1/2α=β=1/3α=β=0α=β=εε>0 ) (patrz także świetny artykuł na Wikipedii ).

αβyn

θyB(α+y,β+ny)

α,βα=β=1n

Na pierwszy rzut oka Haldane wcześniej wydaje się być najbardziej „nieinformacyjny”, ponieważ prowadzi do średniej tylnej, która jest dokładnie równa oszacowaniu maksymalnego prawdopodobieństwa

α+yα+y+β+ny=y/n

y=0y=n

Istnieje wiele argumentów za i przeciw każdemu z „nieinformacyjnych” priorów (patrz Kerman, 2011; Tuyl i in., 2008). Na przykład, jak omówili Tuyl i in.,

101

Z drugiej strony, stosowanie jednolitych priorytetów dla małych zestawów danych może mieć bardzo duży wpływ (pomyśl o tym w kategoriach pseudo-rachunków). O wiele więcej informacji i dyskusji na ten temat można znaleźć w wielu artykułach i podręcznikach.

Przykro mi, ale nie ma żadnych priorytetów „najlepszy”, „najbardziej nieinformacyjny” lub „jeden rozmiar”. Każdy z nich wprowadza do modelu pewne informacje.

Kerman, J. (2011). Neutralne nieinformacyjne i pouczające sprzężone beta i gamma wcześniejsze dystrybucje. Electronic Journal of Statistics, 5, 1450-1470.

Tuyl, F., Gerlach, R. i Mengersen, K. (2008). Porównanie Bayesa-Laplace'a, Jeffreysa i innych przełożonych. The American Statistician, 62 (1): 40–44.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.