Keith Winstein,
EDYCJA: Aby wyjaśnić, ta odpowiedź opisuje przykład podany w Keith Winstein Odpowiedź na króla z okrutną grą statystyczną. Zarówno odpowiedzi bayesowskie, jak i częste korzystają z tych samych informacji, co ma na celu zignorowanie informacji o liczbie uczciwych i niesprawiedliwych monet przy konstruowaniu przedziałów. Jeśli ta informacja nie zostanie zignorowana, częsty powinien użyć zintegrowanego prawdopodobieństwa beta-dwumianowego jako rozkładu próbkowania przy konstruowaniu przedziału ufności, w którym to przypadku przedział ufności Cloppera-Pearsona nie jest odpowiedni i musi zostać zmodyfikowany. Podobna korekta powinna nastąpić w rozwiązaniu Bayesa.
EDYCJA: Wyjaśniłem również początkowe użycie Cloppera Pearson Interval.
EDYCJA: niestety moja alfa jest niewłaściwa, a interwał mojego cloppera-pearsona jest nieprawidłowy. Moje najskromniejsze przeprosiny dla @whuber, który słusznie to zauważył, ale z którym początkowo się nie zgadzałem i ignorowałem.
Metoda CI korzystająca z metody Cloppera Pearsona jest bardzo dobra
θ
[Pr(Bi(1,θ)≥X)≥α2]∩[Pr(Bi(1,θ)≤X)≥α2]
X=1Pr(Bi(1,θ)≥1)=θPr(Bi(1,θ)≤1)=1θ≥α21≥α2X=1X=0Pr(Bi(1,θ)≥0)=1Pr(Bi(1,θ)≤0)=1−θ1−θ≥α2θ≤1−α2X=0[0.025,1]X=1[0,0.975]X=0
Zatem osoba korzystająca z przedziału ufności Cloppera Pearsona nigdy nie zostanie ścięta. Po zaobserwowaniu interwału jest to zasadniczo cała przestrzeń parametrów. Ale interwał CP robi to, zapewniając 100% pokrycia przypuszczalnie 95% interwału! Zasadniczo częste „oszukują”, dając 95% przedział ufności większy zasięg niż on / ona został poproszony (chociaż kto by nie oszukiwał w takiej sytuacji? Gdybym to był ja, dałbym całość [0, 1] interwał). Gdyby król poprosił o dokładnie 95% CI, ta metoda częstokroć nie udałaby się bez względu na to, co się faktycznie wydarzyło (być może jest lepsza?).
Co z interwencją bayesowską? (w szczególności interwał Bayesa z najwyższym odstępstwem tylnym (HPD))
(θ|X)∼Beta(1+X,2−X)Pr(θ≥θe|x=1)=1−(θe)2Pr(θ≤θe|x=0)=1−(1−θe)2θe=0.05−−−−√≈0.224X=1θe=1−0.05−−−−√≈0.776X=0(0,0.776)X=0(0.224,1)X=1
11012+1×110≈0
0.1
0.0250.975
Aby zacytować prawdziwy 95% przedział ufności, z definicji powinny istnieć pewne przypadki (tj. Przynajmniej jeden) obserwowanego przedziału, które nie zawierają prawdziwej wartości parametru . W przeciwnym razie, jak uzasadnić znacznik 95%? Czy nazwanie go przedziałem 90%, 50%, 20%, a nawet 0% byłoby nieważne?
Nie rozumiem, jak proste jest stwierdzenie „w rzeczywistości oznacza 95% lub więcej” bez dodatkowych ograniczeń. Wynika to z faktu, że oczywistym rozwiązaniem matematycznym jest cała przestrzeń parametrów, a problem jest trywialny. załóżmy, że chcę 50% CI? jeśli ogranicza tylko fałszywe negatywy, to cała przestrzeń parametrów jest poprawnym CI, używając tylko tych kryteriów.
100%X=0100×1012+9101012+1%>95%X=1
Na zakończenie wydaje się nieco dziwne poprosić o przedział niepewności, a następnie ocenić ten przedział, używając prawdziwej wartości, której nie byliśmy pewni. „Bardziej sprawiedliwe” porównanie, zarówno pod względem pewności, jak i wiarygodnych przedziałów, wydaje mi się prawdą stwierdzenia niepewności podawanego z tym przedziałem .