Ogólny błąd typu I podczas wielokrotnego testowania gromadzących dane

Mam pytanie dotyczące grupowych metod sekwencyjnych .

Według Wikipedii:

W randomizowanym badaniu z dwiema grupami leczenia stosuje się klasyczne sekwencyjne badanie grupowe w następujący sposób: Jeśli dostępnych jest n osobników w każdej grupie, przeprowadzana jest analiza tymczasowa na 2 osobach. Analizę statystyczną przeprowadza się w celu porównania dwóch grup, a jeśli hipoteza alternatywna zostanie zaakceptowana, badanie zostanie zakończone. W przeciwnym razie próba będzie kontynuowana dla kolejnych 2n pacjentów, z n osobnikami na grupę. Analizę statystyczną przeprowadza się ponownie na 4n osobach. Jeśli alternatywa zostanie zaakceptowana, wówczas próba zostanie zakończona. W przeciwnym razie kontynuuje się okresowe oceny, aż dostępnych będzie N zestawów 2n przedmiotów. W tym momencie przeprowadzany jest ostatni test statystyczny, a badanie jest przerywane

Ale poprzez wielokrotne testowanie gromadzących dane w ten sposób poziom błędu typu I jest zawyżony ...

Gdyby próbki były od siebie niezależne, ogólny błąd typu I, , byłby $\alpha^{\star}$

$\alpha^{\star} = 1 - (1 - \alpha)^k$

gdzie to poziom każdego testu, zaś to liczba tymczasowych wyglądów. $\alpha$ $k$

Ale próbki nie są niezależne, ponieważ się pokrywają. Zakładając, że analizy okresowe są przeprowadzane z jednakowymi przyrostami informacji, można stwierdzić, że (slajd 6)

wprowadź opis zdjęcia tutaj

Czy możesz mi wyjaśnić, w jaki sposób uzyskano ten stół?

multiple-comparisons clinical-trials type-i-and-ii-errors

— ocram
źródło

Poniższe slajdy, do 14, wyjaśniają ten pomysł. Chodzi o to, jak zauważasz, że sekwencja statystyk jest skorelowana.

Kontekstem jest test Z ze znanym odchyleniem standardowym. Pierwsza statystyka testowa , odpowiednio wystandaryzowana, ma rozkład normalny (0,1) z cdf . Podobnie robi druga statystyka , ale - ponieważ pierwsza wykorzystuje podzbiór danych użytych do drugiej - dwie statystyki są skorelowane ze współczynnikiem korelacji . Dlatego ma rozkład dwumianowy. Prawdopodobieństwo błędu typu I (zgodnie z hipotezą zerową) jest równe prawdopodobieństwu, że (a) błąd typu I wystąpi w pierwszym teście lub (b) błąd typu I nie wystąpi w pierwszym teście, ale wystąpi w drugi test. Niech $z_1$ $\Phi$ $z_2$ $\sqrt{1/2}$ $(z_1, z_2)$ $c = \Phi^{-1}(1 - 0.05/2)$ być wartością krytyczną (dla testu dwustronnego o wielkości nominalnej = 0,05). Wtedy szansa na błąd typu I po dwóch analizach równa się szansie, że lub i . Całkowanie numeryczne daje wartość 0,0831178 dla tego prawdopodobieństwa, zgodnie z tabelą. Kolejne wartości w tabeli są uzyskiwane z podobnym uzasadnieniem (i bardziej skomplikowanymi integracjami). $\alpha$ $|z_1| > c$ $|z_1| \le c$ $|z_2| > c$

Ta grafika przedstawia binormalny plik pdf i region integracji (jednolita powierzchnia). Binormal PDF, wykres powierzchni 3D

— Whuber
źródło

Rozumiem, dziękuję! Czy trudno jest uzyskać korelację kore (z1, z2)?

— ocram

@ Marco, Korelacja jest łatwa do obliczenia, ponieważ statystyka testu jest tak prosta: jest to liniowa kombinacja zmiennych normalnych. (Jest tak, ponieważ zakładamy, że wariancja jest znana.) Alternatywnie możesz myśleć o drugiej statystyce jako o sumie dwóch niezależnych zmiennych losowych: pierwszej, , plus zmiany utworzonej przez dodatkowe dane, . W bardziej skomplikowanych przypadkach korelacja może być dość trudna do obliczenia: to jeden z powodów, dla których ta nieco wyidealizowana sytuacja służy do motywowania kolejnych testów!

z_{1}

$z_1$

z_{1} - z_{2}

$z_1 - z_2$

— whuber

Dziękuję Ci bardzo. Tak, korelacja wydaje się dość łatwa do obliczenia. W rzeczywistości nie było dla mnie jasne, że kontekstem było porównanie średnich dwóch rozkładów normalnych. Teraz jest jasne, a wszystko inne jest bardzo jasne! Dziękuję Ci!

— ocram

czy możesz podać wzór (lub kod R), jak to obliczyć dla np. n = 400? Zrobiłbym to sam, ale niestety nie wiem jak. I jak musiałbym dostosować wzór, jeśli chcę obliczyć ogólny poziom błędu, jeśli mam wiele porównań (np. Porównując 4 proporcje) i nie robię korekty jak Bonferroni i powtarzam testy? Czy możesz mi w tym pomóc?

— Andreas