Mam dwie mocno wypaczone próbki i próbuję użyć ładowania początkowego w celu porównania ich średnich za pomocą statystyki t.
Jaka jest poprawna procedura, aby to zrobić?
Proces, którego używam
Niepokoi mnie właściwość zastosowania standardowego błędu oryginalnych / zaobserwowanych danych w ostatnim etapie, gdy wiem, że nie jest to normalnie rozpowszechniane.
Oto moje kroki:
- Bootstrap - losowo próbka z zamiennikiem (N = 1000)
- Oblicz statystyki t dla każdego paska startowego, aby utworzyć rozkład t:
- Oszacuj t przedziały ufności, otrzymując i 1 - α / 2 percentyle rozkładu t
Uzyskaj przedziały ufności poprzez:
- Spójrz, gdzie mieszczą się przedziały ufności, aby ustalić, czy istnieje znacząca różnica w średnich (tj. Niezerowych)
Patrzyłem też na sumę rang Wilcoxona, ale nie daje ona bardzo rozsądnych wyników z powodu bardzo mocno wypaczonego rozkładu (np. 75. = = 95. percentyl). Z tego powodu chciałbym dalej badać test t bootstrapped.
Więc moje pytania to:
- Czy to odpowiednia metodologia?
- Czy właściwe jest użycie SE obserwowanych danych, gdy wiem, że jest mocno wypaczony?
Możliwy duplikat: jaka metoda jest preferowana, test ładowania początkowego lub test nieparametryczny oparty na rankingu?