Twoje pytanie jest doskonałym przykładem modeli regresji z predyktorami ilościowymi i jakościowymi . W szczególności trzy grupy wiekowe - - są zmiennymi jakościowymi, a zmiennymi ilościowymi są nawyki zakupowe i utrata masy ciała (zgaduję, ponieważ obliczasz korelacje).1 , 2 , i3)
Muszę podkreślić, że jest to znacznie lepszy sposób modelowania niż obliczanie osobnych korelacji grupowych, ponieważ masz więcej danych do modelowania, dlatego twoje oszacowania błędów (wartości p itp.) Będą bardziej wiarygodne. Bardziej technicznym powodem jest wynikający z tego wyższy stopień swobody w statystyce testu t do testowania istotności współczynników regresji.
Działając zgodnie z zasadą, że jakościowymi predyktorami można zarządzać za zmiennych wskaźnikowych , potrzebne są tutaj tylko dwie zmienne wskaźnikowe, , które są zdefiniowane w następujący sposób:doc - 1X1,X2)
X1= 1, jeśli osoba należy do grupy 1 ; 0 w przeciwnym razie .
X2)= 1, jeśli osoba należy do grupy 2 ; 0 w przeciwnym razie .
Oznacza to, że grupa jest reprezentowana przez ; stanowią odpowiedź - zakupy zwyczaj jako i ilościowej odchudzania zmiennej objaśniającej jak . Pasujesz teraz do tego modelu liniowego3)X1= 0 ,X2)= 0YW.
mi[ Y] =β0+β1X1+β2)X2)+β3)W..
Oczywistym pytaniem jest to, czy ma znaczenie, czy zmienimy i (ponieważ losowo wybrałem nawyki zakupowe jako zmienną odpowiedzi). Odpowiedź brzmi: tak - szacunki współczynników regresji zmienią się, ale test „asocjacji” między uwarunkowanymi grupami (tutaj test t, ale jest taki sam jak test korelacji dla jednej zmiennej predykcyjnej) nie będzie zmiana. Specjalnie
W.Y
mi[ Y] =β0+β3)W. - dla trzeciej grupy ,
mi[ Y] = (β0+β2)) +β3)W. - dla drugiej grupy ,
mi[ Y] = (β0+β1) +β3)W. - dla pierwszej grupy ,
to jest to równoważne z 3 oddzielnych linii, w zależności od grupy, jeśli działki vs . Jest to dobry sposób na wizualizację tego, co testujesz, ma sens (w zasadzie forma EDA i sprawdzania modelu, ale musisz odpowiednio odróżnić pogrupowane obserwacje). Trzy równoległe linie wskazują brak interakcji między trzema grupami i , a wiele interakcji oznacza, że linie te będą się przecinać.
YW.W.
Jak przeprowadzane są testy? Zasadniczo po dopasowaniu modelu i uzyskaniu oszacowań należy przetestować niektóre kontrasty. Specjalnie dla twoich porównań:
Grupa 2 vs Grupa 3: β2)+β0-β0= 0 ,
Grupa 1 vs Grupa 3: β1+β0-β0= 0 ,
Grupa 2 vs Grupa 1: β2)+β0- (β0+β1) = 0.