Jak wykonać test ładowania początkowego, aby porównać średnie z dwóch próbek?

Mam dwie mocno wypaczone próbki i próbuję użyć ładowania początkowego w celu porównania ich średnich za pomocą statystyki t.

Jaka jest poprawna procedura, aby to zrobić?

Proces, którego używam

Niepokoi mnie właściwość zastosowania standardowego błędu oryginalnych / zaobserwowanych danych w ostatnim etapie, gdy wiem, że nie jest to normalnie rozpowszechniane.

Oto moje kroki:

Bootstrap - losowo próbka z zamiennikiem (N = 1000)
Oblicz statystyki t dla każdego paska startowego, aby utworzyć rozkład t: $T (b) = \frac{({\bar{X}}_{b 1} - {\bar{X}}_{b 2}) - ({\bar{X}}_{1} - {\bar{X}}_{2})}{\sqrt{σ_{x b 1}^{2} / n + σ_{x b 2}^{2} / n}}$ $T(b) = \frac{(\overline{X}_{b1}-\overline{X}_{b2})-(\overline{X}_1-\overline{X}_2) }{\sqrt{ \sigma^2_{xb1}/n + \sigma^2_{xb2}/n }}$
Oszacuj t przedziały ufności, otrzymując i percentyle rozkładu t $\alpha/2$ $1-\alpha/2$
Uzyskaj przedziały ufności poprzez:

$C I_{L} = ({\bar{X}}_{1} - {\bar{X}}_{2}) - T_C I_{L} . S E_{o r i g i n a l}$ $CI_L = (\overline{X}_1-\overline{X}_2) - T\_{CI_L}.SE_{original}$ $C I_{U} = ({\bar{X}}_{1} - {\bar{X}}_{2}) + T_C I_{U} . S E_{o r i g i n a l}$ $CI_U = (\overline{X}_1-\overline{X}_2) + T\_{CI_U}.SE_{original}$ $S E = \sqrt{σ_{X 1}^{2} / n + σ_{X 2}^{2} / n}$ $SE = \sqrt{ \sigma^2_{X1}/n + \sigma^2_{X2}/n }$
Spójrz, gdzie mieszczą się przedziały ufności, aby ustalić, czy istnieje znacząca różnica w średnich (tj. Niezerowych)

Patrzyłem też na sumę rang Wilcoxona, ale nie daje ona bardzo rozsądnych wyników z powodu bardzo mocno wypaczonego rozkładu (np. 75. = = 95. percentyl). Z tego powodu chciałbym dalej badać test t bootstrapped.

Więc moje pytania to:

Czy to odpowiednia metodologia?
Czy właściwe jest użycie SE obserwowanych danych, gdy wiem, że jest mocno wypaczony?

Możliwy duplikat: jaka metoda jest preferowana, test ładowania początkowego lub test nieparametryczny oparty na rankingu?

hypothesis-testing t-test bootstrap

— CatsLoveJazz
źródło

Jak duże są próbki?

— Michael M.

@Michael Mayer Około 800

— CatsLoveJazz

Zobacz także stats.stackexchange.com/questions/189587

— mówi Przywróć Monikę

Po prostu zrobiłbym regularny test bootstrap:

obliczyć statystykę t w swoich danych i zapisać ją
zmienić dane tak, aby hipoteza zerowa była prawdziwa. W takim przypadku odejmij średnią z grupy 1 dla grupy 1 i dodaj ogólną średnią, i zrób to samo dla grupy 2, w ten sposób średnie w obu grupach będą średnią ogólną.
Pobierz próbki ładowania początkowego z tego zestawu danych, prawdopodobnie rzędu 20 000.
oblicz statystyki t dla każdej z tych próbek ładowania początkowego. Rozkład tych statystyk t jest oszacowaniem początkowym rozkładu próbkowania statystyki t w przekrzywionych danych, jeśli hipoteza zerowa jest prawdziwa.
$p$ $($ $+1)$ $($ $+1)$

Możesz przeczytać więcej na ten temat w:

Rozdział 4 AC Davison i DV Hinkley (1997) Metody ładowania i ich zastosowanie . Cambridge: Cambridge University Press.
Rozdział 16 Bradley Efron i Robert J. Tibshirani (1993) Wprowadzenie do Bootstrap . Boca Raton: Chapman & Hall / CRC.
Wpis w Wikipedii dotyczący testowania hipotez bootstrap.

— Maarten Buis
źródło

Zasadniczo to robię, ale patrząc na proporcję, w której pierwotna / obserwowana statystyka t jest> = statystyki t butyrapped. Czy w pierwszej kolejności można wykonać test t na mocno wypaczonych danych, jest to jeden z powodów, dla których chcę zwiększyć wydajność.

— CatsLoveJazz

Technicznie rzecz biorąc, do testu ładowania początkowego potrzebujesz tylko statystyki testu, aby nie stanowiło to problemu. Zasadniczo test t porównuje średnie, a w przypadku wypaczonych danych mediany są często bardziej znaczące niż średnie. Zatem test porównujący mediany zamiast środków może mieć większy sens. Zależy to jednak od twojej hipotezy zerowej, która jest twoim wyborem i twoim wyborem.

— Maarten Buis

Ok, dziękuję, to jest środek, który chcemy przetestować, ponieważ wszystkie nasze inne wyniki były w tej formie.

— CatsLoveJazz