Załóżmy, że mamy scenariusz wielokrotnych porównań, takich jak wnioskowanie post hoc na statystyce parami lub jak regresja wielokrotna, w której dokonujemy w sumie porównań. Załóżmy również, że chcielibyśmy poprzeć wnioskowanie w tych wielokrotnościach z wykorzystaniem przedziałów ufności.
1. Czy stosujemy wiele korekt porównawczych do elementów CI? Oznacza to, że podobnie jak wielokrotne porównania zmuszają redefinicję do rodzinnego wskaźnika błędów (FWER) lub współczynnika fałszywych odkryć (FDR), ma znaczenie pewność (lub wiarygodność 1 , niepewność, prognoza) lub inferencyjne ... wybierz przedział) lub podobnie zmieniony przez wiele porównań? Zdaję sobie sprawę, że negatywna odpowiedź tutaj będzie przytaczać moje pozostałe pytania.
2. Czy istnieją proste tłumaczenia procedur korekty wielu porównań, od testowania hipotez po oszacowanie przedziału? Na przykład, czy zmiany koncentrowałyby się na zmianie terminu w przedziale ufności: ?
3. W jaki sposób rozwiązalibyśmy procedury kontroli podwyższającej lub zmniejszającej dla instytucji kredytowych? Niektóre rodzinne korekty poziomu błędu z podejścia do wnioskowania opartego na testowaniu hipotez są „statyczne”, tzn. Dokładnie taka sama korekta jest dokonywana dla każdego oddzielnego wnioskowania. Na przykład korekty Bonferroni dokonuje się, zmieniając kryterium odrzucenia z:
- odrzuć, jeśli do:
- odrzuć, jeśli ,
ale regulacja stopniowania Holm-Bonferroni nie jest „statyczna”, ale raczej:
- pierwsze zamówienie wartości najmniejszych do największych, a następnie
- odrzuć, jeśli , (gdzie indeksuje kolejność wartości ) do
- nie odrzucamy hipotezy zerowej i automatycznie nie odrzucamy wszystkich kolejnych hipotez zerowych.
Ponieważ odrzucenie / brak odrzucenia nie zdarza się w przypadku elementów CI (bardziej formalnie, patrz odnośniki poniżej), czy to oznacza, że procedury krokowe nie tłumaczą (tj. Obejmują wszystkie metody FDR)? Powinienem tutaj ostrzec, że nie pytam, jak przełożyć CI na testy hipotez (przedstawiciele cytowanej poniżej literatury dotyczącej „testowania hipotez wizualnych” dostają to nietrywialne pytanie).
4. Co z innymi przedziałami, o których wspominałem w nawiasach w 1?
1 Rany, mam nadzieję , że nie wpakuję się w te słodkie rockowe style bayesowskie, używając tego słowa tutaj. :)
Literatura
Afshartous, D. i Preston, R. (2010). Przedziały ufności dla danych zależnych: Zrównanie nie nakładania się ze znaczeniem statystycznym. Statystyka obliczeniowa i analiza danych , 54 (10): 2296–2305.
Cumming, G. (2009). Wnioskowanie na podstawie wzroku: odczytanie nakładania się niezależnych przedziałów ufności. Statystyka w medycynie , 28 (2): 205–220.
Payton, ME, Greenstone, MH, i Schenker, N. (2003). Nakładające się przedziały ufności lub standardowe przedziały błędów: Co oznaczają pod względem istotności statystycznej? Journal of Insect Science , 3 (34): 1–6.
Tryon, WW i Lewis, C. (2008). Metoda inferencyjnego przedziału ufności służąca do ustalenia równoważności statystycznej, która koryguje współczynnik redukcji Tryona (2001). Metody psychologiczne , 13 (3): 272–277.