Czy istnieje test statystyczny umożliwiający porównanie dwóch próbek wielkości 1 i 3?


19

W ramach projektu dotyczącego ekologii moja grupa laboratoryjna dodała ocet do 4 zbiorników zawierających równe objętości wody w stawie, 1 kontrolę bez elodei (rośliny wodnej) i 3 zabiegi z taką samą ilością elodei w każdym. Celem dodania octu było obniżenie pH. Hipoteza była taka, że ​​zbiorniki z elodeą szybciej wróciłyby do normalnego pH. Tak było w istocie. Mierzyliśmy pH każdego zbiornika codziennie przez około dwa tygodnie. Wszystkie zbiorniki ostatecznie powróciły do ​​swojego naturalnego pH, ale czas, który to zajęło, był znacznie krótszy dla zbiorników z elodeą.

Kiedy powiedzieliśmy naszemu profesorowi o naszym projekcie eksperymentalnym, powiedział, że nie ma testu statystycznego, który można by przeprowadzić na danych w celu porównania kontroli z leczeniem. Ponieważ ponieważ nie było powtórzenia dla kontroli (użyliśmy tylko jednego zbiornika kontrolnego), nie możemy obliczyć wariancji, więc nie możemy porównać średnich próbek z kontroli i leczenia. Więc moje pytanie brzmi: czy to prawda? Zdecydowanie rozumiem, o co mu chodzi. Na przykład, jeśli wziąłeś wysokość jednego mężczyzny i jednej kobiety, nie możesz wyciągać wniosków na temat ich populacji. Ale wykonaliśmy 3 zabiegi, a wariancja była niewielka. Rozsądne wydaje się założenie, że wariancja byłaby podobna w kontroli?

Aktualizacja:

Dziękuję za doskonałą odpowiedź. Dostaliśmy więcej wody i elodei z mokradeł i zdecydowaliśmy, że ponownie przeprowadzimy eksperyment z mniejszymi zbiornikami, ale tym razem z 5 kontrolami i 5 zabiegami. Zamierzaliśmy połączyć to z naszymi oryginalnymi danymi, ale początkowe pH zbiorników było na tyle różne, że rozważenie nowego eksperymentu z tej samej populacji, co eksperyment pierwotny, nie wydaje się uzasadnione.

Zastanawialiśmy się nad dodaniem różnych ilości elodei i próbą skorelowania prędkości remediacji pH (mierzonej jako czas, który upłynął do powrotu wartości pH do pierwotnej wartości) z ilością elodei, ale zdecydowaliśmy, że nie jest to konieczne. Naszym celem jest jedynie wykazanie, że elodea robi pozytywną różnicę, a nie skonstruowanie pewnego rodzaju modelu predykcyjnego dla dokładnie tego, jak pH reaguje na różne ilości elodei. Interesujące byłoby określenie optymalnej ilości elodei, ale to prawdopodobnie tylko maksymalna ilość, która może przetrwać. Próba dopasowania krzywej regresji do danych nie byłaby szczególnie pouczająca z powodu różnych skomplikowanych zmian, które zachodzą w społeczności przy dodawaniu dużej ilości. Elodea umiera, rozkłada się, nowe organizmy zaczynają dominować i tak dalej.


4
Czy dodałeś taką samą ilość Elodei do każdego z 3 zbiorników „uzdatniających”?
gung - Przywróć Monikę

2
Tak, dodaliśmy taką samą ilość Elodea do każdego zabiegu.
Simon Hunt

Odpowiedzi:


21

Zwróć uwagę na pytanie Gunga; to ma znaczenie. Zakładam, że leczenie było takie samo dla każdego zbiornika w grupie leczenia.

Jeśli możesz argumentować, że wariancja byłaby równa dla dwóch grup (co i tak zazwyczaj zakładasz dla dwóch próbnych testów t), możesz wykonać test. Po prostu nie możesz sprawdzić tego założenia, bez względu na to, jak bardzo może być ono naruszone.

Obawy wyrażone w tej odpowiedzi na powiązane pytanie są jeszcze bardziej adekwatne do twojej sytuacji, ale niewiele możesz na to poradzić.

[Pytasz, czy rozsądne jest założenie, że wariancje są równe. Nie możemy ci odpowiedzieć na to pytanie, trzeba przekonać ekspertów merytorycznych (tj. Ekologów), że było to uzasadnione założenie. Czy istnieją inne badania, w których takie poziomy mierzono zarówno pod względem leczenia, jak i kontroli? Inne, w których przeprowadzono podobne testy (szczególnie testy t lub anova - założę się, że można znaleźć lepszy precedens) lub przyjęto podobne założenia? Jakieś ogólne uzasadnienie, które możesz zastosować?]

Jeśli jest średnią próbki dla leczenia, a jest średnią kontroli, a oba pochodzą z rozkładów normalnych z wariancją , to będzie oznaczać i wariancję niezależnie od tego, czy jedna z wartości to 1.x¯y¯σ2)x¯-y¯μx-μyσ2)(1/nx+1/ny)n

Więc kiedy wynosi 1,ny

(x¯-y¯)sx1/nx+1

(gdzie jest standardowym odchyleniem obliczonym z zabiegów) zostanie podzielone na (z stopniami swobody) poniżej zera.sxtnx-1

Można zauważyć, że przy najlepszym dostępnym oszacowaniu , zastosowanym dla , jest to dokładnie tak, jak zwykła formuła testu dwóch prób z ustawionym na 1.σsxspny

Edytować:

Oto symulowana krzywa mocy dla tego testu. Wielkość próbki przy wartości zerowej wynosiła 10000, w pozostałych punktach wynosiła 1000. Jak widać, współczynnik odrzucania przy wartości zerowej wynosi 0,05, a krzywa mocy, choć wymaga dużej różnicy w populacji, ma przyzwoitą moc, ma odpowiedni kształt. Oznacza to, że ten test działa tak, jak powinien.

krzywa mocy

(Zakończ edycję)

Jednak przy tak małych próbkach będzie to nieco wrażliwe na założenia dystrybucyjne.

Jeśli jesteś przygotowany na różne założenia lub chcesz sprawdzić równość niektórych innych populacji, niektóre testy mogą być nadal możliwe.

Więc nie wszystko stracone ... ale tam, gdzie to możliwe, ogólnie lepiej jest mieć przynajmniej trochę replikacji w obu grupach.


1
Pamiętaj, że musisz postępować zgodnie z przedstawionymi formułami @Glen_b. Zarówno Excel, jak i Minitab tego nie obliczą.
zbicyclist

10
(+1) Równoważne podejście (przy użyciu tej samej formuły) - a zatem więcej amunicji dla uzasadnienia tej odpowiedzi - polega na tym, że można obliczyć przedział prognozy dla jednej przyszłej wartości z grupy leczenia. Jeśli wartość kontrolna nie mieści się w tym przedziale prognoz, masz znaczący dowód różnicy między dwiema grupami. Różnica może być jakąś kombinacją różnicy średniej lub różnicy wariancji, ale istnieje (prawdopodobnie) różnica.
whuber

3
@bdemarest Ciekawa myśl, ale nie działa. Zapewnia, że ​​wartość „12” jest dokładnie znana (zamiast być losową obserwacją z rozkładu z sd ), co prowadzi do formuły - w tym konkretnym przypadku wartość pod pierwiastkiem kwadratowym jest równa jednej czwartej tego, co powinna, a zatem wartość jest dwa razy większa niż powinna. σ(x¯12)sx1/nxt
Glen_b

2
@Glen_b: Nie jestem pewien, czy zmieniło się to w listopadzie zeszłego roku, ale R 3.0 wykona test t-pool, gdy jeden z rozmiarów próbki ma jeden, i daje taką samą odpowiedź jak anova.
Aaron - Przywróć Monikę

2
Dla każdego, kto chce spróbować w R: t.test(x=c(4.5,4.8,4.6),y=5.2, var.equal=TRUE) - wygląda na to, że działa zarówno w R2.15.2, jak i R3.0.0 (tylko dwie wersje, które mam pod ręką).
Glen_b
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.