Wyeliminuję wszystkie szczegóły biologiczne i eksperymenty i przytoczę tylko problem i to, co zrobiłem statystycznie. Chciałbym wiedzieć, czy ma rację, a jeśli nie, jak postępować. Jeśli dane (lub moje wyjaśnienie) nie są wystarczająco jasne, postaram się lepiej wyjaśnić, edytując.
Załóżmy, że mam dwie grupy / obserwacje, X i Y, o rozmiarze i . Chciałbym wiedzieć, czy środki tych dwóch obserwacji są równe. Moje pierwsze pytanie brzmi:
Jeśli założenia są spełnione, czy istotne jest tutaj zastosowanie parametrycznego testu t dla dwóch próbek? Pytam o to, ponieważ z mojego rozumienia jest on zwykle stosowany, gdy rozmiar jest mały?
Wykreśliłem histogramy zarówno X, jak i Y, i nie były one normalnie rozłożone, co jest jednym z założeń testu t dla dwóch próbek. Moje zamieszanie polega na tym, że uważam je za dwie populacje i dlatego sprawdziłem ich normalną dystrybucję. Ale zaraz zamierzam wykonać dwupróbkowy test t ... Czy to prawda?
Z centralnego twierdzenia o granicy rozumiem, że jeśli wykonujesz próbkowanie (z powtórzeniami / bez, w zależności od liczebności populacji) wiele razy i za każdym razem obliczasz średnią próbek, wówczas rozkład będzie w przybliżeniu normalny. Średnia tych zmiennych losowych będzie dobrym oszacowaniem średniej populacji. Postanowiłem to zrobić na X i Y, 1000 razy, i uzyskałem próbki, i przypisałem losową zmienną do średniej każdej próbki. Fabuła była bardzo rozpowszechniona. Średnia X i Y wynosiła 4,2 i 15,8 (co było takie same jak dla populacji + - 0,15), a wariancja wynosiła 0,95 i 12,11.
Przeprowadziłem test t dla tych dwóch obserwacji (po 1000 punktów danych) z nierównymi wariancjami, ponieważ są one bardzo różne (0,95 i 12,11). Hipoteza zerowa została odrzucona.
Czy to w ogóle ma sens? Czy to poprawne / znaczące podejście lub test na dwóch próbach jest wystarczający, czy całkowicie błędny?Przeprowadziłem również nieparametryczny test Wilcoxona, aby się upewnić (na oryginalnych X i Y), a hipoteza zerowa została tam również przekonująco odrzucona. W przypadku, gdy moja poprzednia metoda była całkowicie błędna, przypuszczam, że wykonanie testu nieparametrycznego jest dobre, z wyjątkiem może mocy statystycznej?
W obu przypadkach średnie były znacząco różne. Chciałbym jednak wiedzieć, czy jedno lub oba podejścia są błędne / całkowicie błędne, a jeśli tak, jaka jest alternatywa?