Jak sprawdzić, czy średnia podgrupy różni się od ogólnej grupy obejmującej podgrupę?


9

Jak mogę sprawdzić, czy średnia (np. Ciśnienie krwi) podgrupy (np. Tych, którzy zmarli) różni się od całej grupy (np. Wszystkich, którzy mieli chorobę, w tym tych, którzy zmarli)?

Oczywiście pierwsza z nich jest podgrupą drugiej.

Jakiego testu hipotez powinienem użyć?


Czy testujesz różnicę środków?
Makro

Odpowiedzi:


9

Jak zauważa Michael, porównując podgrupę z ogólną grupą, badacze zwykle porównują podgrupę z podzbiorem całej grupy, która nie obejmuje podgrupy.

Pomyśl o tym w ten sposób.

Jeśli jest proporcją, która umarła, a jest proporcją, która nie umarła, ip1p

X¯.=pX¯d+(1p)X¯a

gdzieoznacza ogólną średnią, jest średnią tych, którzy zginęli, a jest średnią tych, którzy jeszcze żyją. NastępnieX¯.X¯dX¯a

X¯dX¯a
wtedy i tylko wtedy, gdy

X¯dX¯.

Załóżmy, że . Stąd .Xd¯Xa¯X.¯pXd¯+(1p)Xd¯=Xd¯

Załóżmy, że . Stąd , a następnie i od , a następnie .X.¯Xd¯Xd¯pXd¯+(1p)Xa¯(1p)Xd¯(1p)Xa¯(1p)0Xd¯Xa¯

To samo można zrobić w przypadku nierówności.

Dlatego badacze zazwyczaj testują różnicę między podgrupą a podzbiorem całej grupy, która nie obejmuje podgrupy. To powoduje, że podgrupa różni się od całej grupy. Umożliwia także stosowanie konwencjonalnych metod, takich jak niezależny test t grup.


1
Re: „Powinieneś porównać podgrupę z podzbiorem całej grupy, która nie obejmuje podgrupy” - tak, jest to sposób, aby to zrobić, ale zadaje nieco inne pytanie - testuje martwe kontra nie-martwe, kiedy to wydaje się, PO chce sprawdzić różnicę między środkami martwy i czyimś których status śmiertelność nie jest znana, więc nie jestem pewien, powinien to właściwe słowo. Możesz przetestować różnicę średnich między podzbiorem a grupą ogólną, o ile uwzględnisz kowariancję między a W swoim standardowym obliczeniu błędu. X¯dX¯.
Makro

@Macro dobry punkt. dzięki. Zmieniłem nieco sformułowanie na „naukowcy zazwyczaj…”
Jeromy Anglim

@Marco. Dziękuję za komentarz. Ale jak obliczana jest kowariancja i niepowiązanych grup (podgrupy i grupy)? X¯dX¯
giordano

@JeromyAnglim nie sądzę, że potrzebujesz „typowo”. Jeśli napiszemy to, co napisałeś w notacji populacyjnej (np. Mu zamiast słupków x) i zbadamy hipotezę zerową i alternatywną, za pomocą tego samego argumentu, który podałeś, testowanie, że mu różni się od mu_d, jest identyczne z testowaniem mu_a różni się od mu_d. Zatem wykonanie testu t dla dwóch próbek jest zawsze prawidłowe. Zamiast typowo powiedziałbym: „równoważne jest przeprowadzenie tego testu z testem t dla dwóch próbek”
Richard DiSalvo

2

Sposobem na przetestowanie tutaj jest porównanie tych, którzy mieli chorobę i zmarli, z tymi, którzy mieli chorobę i nie umarli. Możesz zastosować test dwóch próbek t lub test sumy rang Wilcoxona, jeśli nie można założyć normalności.


czy mógłbyś to sprecyzować? jaki rodzaj testu t dwóch próbek? niesparowany test t? Myślałem o t t, zakładasz NIEZALEŻNOŚĆ i NORMALNOŚĆ.
user1061210

1
Gdy grupy są oddzielne, jak sugerowaliśmy, próbki są niezależne. Test t byłby niesparowany, ponieważ podgrupy nie muszą być równe i nie ma naturalnego sposobu parowania próbek, nawet jeśli wielkości próbek byłyby równe. Wspomniałem o teście Wilcoxona, ponieważ założenie normalności może nie być prawidłowe, a test Wilcoxona nie wymaga normalności.
Michael R. Chernick,

0

To, co musisz zrobić, to przetestować proporcje populacji (duża próbka). Statystyki dotyczące proporcji populacji często mają wielkość próby, która jest duża (n => 30), dlatego normalny rozkład aproksymacji i powiązane statystyki są wykorzystywane do ustalenia testu, czy proporcja próby (ciśnienie krwi zmarłych) = proporcja populacji (wszyscy który miał chorobę, w tym tych, którzy zmarli).

Oznacza to, że gdy wielkość próbki jest większa lub równa 30, możemy użyć statystyki z-score do porównania proporcji próbki do proporcji populacji przy użyciu wartości p-odchylenia standardowego próbki, aby oszacować odchylenie standardowe próbki, p jeśli nie jest znany.

Rozkład próbki P (proporcja) jest w przybliżeniu normalny ze średnią lub oczekiwaną wartością, E (P) = p-hat i błąd standardowy, sigma (r) = sqrt (p * q / n).

Oto prawdopodobne pytania testowe, jakie można postawić przy porównywaniu dwóch proporcji:

  1. (Test dwustronny)

H0: p-hat = p vs H1: p-hat nie jest równy p

  1. (Badanie z prawej strony)

H0: p-hat = p vs H1: p-hat> p

  1. (Test lewostronny)

H0: p-hat = p vs H1: p-hat <p

Statystyki używane do testowania dużej próby wynoszą:

Statystyka testu jest związana ze standardowym rozkładem normalnym:

Statystyka wyniku Z dla proporcji

p-hat-p / sqrt (pq / n)

, gdzie p = oszacowanie proporcji, q = 1-p i jest proporcją populacji.

Średnia proporcji to:

np / n = p-hat = x / n

Odchylenie standardowe:

= sqrt (npq / n) = sqrt (pq / n)

Zasady decyzyjne:

Test górnego ogona (): (H0: kapelusz P> = P)

Zaakceptuj H0, jeśli Z <= Z (1-alfa)

Odrzucić H0, jeśli Z> Z (1-alfa)

Test kończyn dolnych (Ha: P-hat <= P):

Zaakceptuj H0, jeśli Z> = Z (1-alfa)

Odrzucić H0, jeśli Z

Test dwustronny (Ha: kapelusz P nie jest równy P):

Zaakceptuj H0, jeśli Z (alfa / 2) <= Z <= Z (1-alfa / 2)

Odrzucić H0, jeśli Z <Z (alfa / 2) lub jeśli Z> Z (1-alfa / 2)

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.