Przykłady przypadków, gdy przedział ufności i przedział wiarygodności pokrywają się


11

W artykule na Wikipedii na temat przedziału wiarygodności napisano:

W przypadku pojedynczego parametru i danych, które można podsumować za pomocą jednej wystarczającej statystyki, można wykazać, że wiarygodny przedział i przedział ufności zbiegną się, jeśli nieznany parametr jest parametrem lokalizacji (tj. Funkcja prawdopodobieństwa przekazania ma postać Pr (x | μ) = f (x - μ)), z uprzednim, który jest równomiernym rozkładem płaskim; [5], a także jeśli nieznany parametr jest parametrem skali (tzn. Funkcja prawdopodobieństwa w przód ma postać Pr (x | s) = f (x / s)), z wcześniejszym Jeffreysem [5] - ten drugi z kolei wynika z tego, że biorąc logarytm takiego parametru skali zamienia go w parametr lokalizacji o rozkładzie równomiernym. Ale są to szczególnie szczególne (aczkolwiek ważne) przypadki; zasadniczo nie można uzyskać takiej równoważności. ”

Czy ludzie mogą podać konkretne przykłady tego? Kiedy 95% CI faktycznie odpowiada „95% szansie”, a tym samym „narusza” ogólną definicję CI?

Odpowiedzi:


13

normalna dystrybucja:

Weź rozkład normalny ze znaną wariancją. Możemy uznać tę wariancję za 1 bez utraty ogólności (po prostu dzieląc każdą obserwację przez pierwiastek kwadratowy wariancji). Ma to rozkład próbkowania:

p(X1...XN|μ)=(2π)N2exp(12i=1N(Xiμ)2)=Aexp(N2(X¯μ)2)

Gdzie jest stałą, która zależy tylko od danych. To pokazuje, że średnia próby jest wystarczającą statystyką dla średniej populacji. Jeśli użyjemy munduru przed, to rozkład tylny dla będzie :μAμ

(μ|X1...XN)Normal(X¯,1N)(N(μX¯)|X1...XN)Normal(0,1)

Tak więc wiarygodny interwał będzie miał postać:1α

(X¯+1NLα,X¯+1NUα)

Gdzie i są wybrane tak, że standardowa normalna zmienna losowa spełnia:LαUαZ

Pr(Lα<Z<Uα)=1α

Teraz możemy zacząć od tej „kluczowej wielkości” do skonstruowania przedziału ufności. Rozkład próbkowania dla fixed jest standardowym rozkładem normalnym, więc możemy podstawić to powyższym prawdopodobieństwem:N(μX¯)μ

Pr(Lα<N(μX¯)<Uα)=1α

Następnie ponownie ułóż rozwiązanie dla , a przedział ufności będzie taki sam, jak przedział wiarygodności.μ

Parametry skali:

W przypadku parametrów skali pliki pdf mają postać . Możemy wziąć , co odpowiada . Łączny rozkład próbkowania wynosi:p(Xi|s)=1sf(Xis)(Xi|s)Uniform(0,s)f(t)=1

p(X1...XN|s)=sN0<X1...XN<s

Z którego wynika, że ​​wystarczająca statystyka jest równa (Maksimum obserwacji). Teraz znajdujemy jego rozkład próbkowania:Xmax

Pr(Xmax<y|s)=Pr(X1<y,X2<y...XN<y|s)=(ys)N

Teraz możemy uczynić to niezależnym od parametru, przyjmując . Oznacza to, że naszą „kluczową ilość” podaje z która jest rozkładem . Możemy więc wybrać używając kwantyli beta, takich jak:y=qsQ=s1XmaxPr(Q<q)=qNbeta(N,1)Lα,Uα

Pr(Lα<Q<Uα)=1α=UαNLαN

Zastępujemy kluczową ilość:

Pr(Lα<s1Xmax<Uα)=1α=Pr(XmaxLα1>s>XmaxUα1)

I jest nasz przedział ufności. W przypadku rozwiązania bayesowskiego z jeffreys przed:

p(s|X1...XN)=sN1XmaxrN1dr=N(Xmax)NsN1
Pr(s>t|X1...XN)=N(Xmax)NtsN1ds=(Xmaxt)N

Teraz podłączamy przedział ufności i obliczamy jego wiarygodność

Pr(XmaxLα1>s>XmaxUα1|X1...XN)=(XmaxXmaxUα1)N(XmaxXmaxLα1)N

=UαNLαN=Pr(Lα<Q<Uα)

I presto, mamy wiarygodność i zasięg.1α


Arcydzieło, dzięki! Miałem nadzieję, że odpowiedź może być taka: „przy obliczaniu średniej próbki z rozkładu normalnego 95% CI w rzeczywistości jest również 95% przedziałem wiarygodności” lub coś w tym rodzaju prostego. (Właśnie wymyślając tę ​​rzekomą odpowiedź, nie mam pojęcia o konkretnych przykładach.)
Wayne

Uważam, że częsty 95% przedział przewidywania / tolerancji odpowiada przedziałowi przewidywania Bayesa z regresją OLS i błędami normalnymi. Wygląda na to, że tak czy inaczej, porównując odpowiedź predykcji.lm z odpowiedzią symulowaną. Czy to prawda?
Wayne,

Dla , jeśli użyjesz munduru przed i jeffreys przed , masz równoważność. α , β σY=α+βXα,βσ
probabilityislogic

Wielkie dzięki! Próbowałem wyjaśnić CI dla regresji, którą zrobiłem w kategoriach Przedziału ufności i po prostu nie łączy się on z laikami, którzy oczekują Wiarygodnego Przedziału. Ułatwia mi życie ... choć może szkodzi ogólnemu statystycznemu światu, ponieważ wzmocni nieporozumienie laika dotyczące CI.
Wayne,

@Wayne - sytuacja jest nieco bardziej ogólna niż tylko rodziny w skali lokalizacji. Zwykle CI będzie równoważne wiarygodnemu przedziałowi, jeśli jest oparty na „wystarczającej statystyce” (jak te dwie były) tam, gdzie to istnieje. Jeśli nie ma wystarczającej statystyki, CI musi uzależnić się od tak zwanych „statystyk pomocniczych”, aby uzyskać wiarygodną interpretację przedziałów.
probabilityislogic
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.