Dlaczego 95% CI dla mediany ma wynosić


11

W różnych źródłach (patrz np. Tutaj ) podano następujący wzór na przedział ufności dla mediany (szczególnie w celu rysowania wycięć na wykresach pudełkowych i wąsów):

95% CImedian=Median±1.57×IQRN

Stała magia mnie do szału, nie mogę zrozumieć, w jaki sposób została uzyskana. Różne aproksymacje (np. Zakładamy, że nasz rozkład jest gaussowski, a jest duży) nie dają żadnych wskazówek - otrzymuję różne wartości dla stałej.N.1.57N


Odpowiedzi:


15

To łatwe. Jeśli sprawdzimy oryginalny papier, w którym wprowadzono wycięte wykresy pudełkowe i wąsy ( Robert McGill, John W. Tukey i Wayne A. Larsen. Variations of Box Plots, The American Statistician, t. 32, nr 1 (luty, 1978), s. 12-16 ; na szczęście jest na JSTOR ), znaleźliśmy rozdział 7, w którym ta formuła jest uzasadniona w następujący sposób:

Gdyby ktoś chciał wycięcia wskazującego 95-procentowy przedział ufności w odniesieniu do każdej mediany, zastosowane byłoby C = 1,96. [Tutaj C jest inną stałą, która jest związana z naszą, ale dokładna relacja nie ma znaczenia, co zostanie wyjaśnione później - IS] Jednakże, ponieważ pożądana była forma „wskaźnika luki”, która wskazywałaby na znaczące różnice na poziomie 95 procent , nie zostało to zrobione. Można wykazać, że C = 1,96 byłoby odpowiednie tylko wtedy, gdy standardowe odchylenia dwóch grup byłyby znacznie różne. Gdyby były prawie równe, C = 1,386 byłby odpowiednią wartością, przy 1,96 skutkującym zdecydowanie zbyt rygorystycznym testem (znacznie przekraczającym 99 procent). Wartość między tymi granicami, C = 1,7, wybrano empirycznie jako preferowana. Zatem zastosowane wycięcia zostały obliczone jakoM±1.7(1.25R/1.35N) .

Nacisk jest mój. Zauważ, że , co jest twoją magiczną liczbą.1.7×1.25/1.35=1.57

Krótka odpowiedź brzmi więc: nie jest to ogólna formuła mediany CI, ale szczególne narzędzie do wizualizacji, a stała została wybrana empirycznie do osiągnięcia określonego celu.

Nie ma magii.

Przepraszam.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.