Dostaję trochę kłopotliwych wyników dla korelacji sumy z trzecią zmienną, gdy dwa predyktory są ujemnie skorelowane. Co powoduje te kłopotliwe wyniki?
Przykład 1: Korelacja między sumą dwóch zmiennych a trzecią zmienną
Rozważ wzór 16.23 na stronie 427 tekstu Guildforda z 1965 r., Pokazany poniżej.
Zakłopotanie: jeśli obie zmienne korelują .2 z trzecią zmienną i korelują -.7 ze sobą, formuła daje wartość .52. W jaki sposób korelacja sumy z trzecią zmienną może wynosić 0,52, jeśli każda z dwóch zmiennych koreluje tylko .2 z trzecią zmienną?
Przykład 2: Jaka jest wielokrotna korelacja między dwiema zmiennymi a trzecią zmienną?
Rozważ wzór 16.1 na stronie 404 tekstu Guildforda z 1965 r. (Pokazany poniżej).
Niepokojące odkrycie: ta sama sytuacja. Jeśli obie zmienne korelują .2 z trzecią zmienną i korelują -.7 ze sobą, formuła daje wartość .52. W jaki sposób korelacja sumy z trzecią zmienną może wynosić 0,52, jeśli każda z dwóch zmiennych koreluje tylko .2 z trzecią zmienną?
Próbowałem szybkiej małej symulacji Monte Carlo, która potwierdza wyniki formuł Guilforda.
Ale jeśli każdy z dwóch predyktorów przewiduje 4% wariancji trzeciej zmiennej, w jaki sposób ich suma przewiduje 1/4 wariancji?
Źródło: Fundamental Statistics in Psychology and Education, 4th ed., 1965.
WYJAŚNIENIE
Sytuacja, z którą mam do czynienia, polega na przewidywaniu przyszłych wyników poszczególnych osób na podstawie pomiaru ich umiejętności.
Dwa poniższe diagramy Venna pokazują moje rozumienie sytuacji i mają na celu wyjaśnienie mojego zdziwienia.
Ten diagram Venna (ryc. 1) odzwierciedla zerowy rząd r = .2 między x1 i C. W moim polu istnieje wiele takich zmiennych predykcyjnych, które skromnie przewidują kryterium.
Ten diagram Venna (ryc. 2) odzwierciedla dwa takie predyktory, x1 i x2, każdy przewidujący C przy r = .2 i dwa predyktory ujemnie skorelowane, r = - .7.
Nie potrafię sobie wyobrazić związku między dwoma predyktorami r = .2, które sprawiłyby, że razem przewidywałyby 25% wariancji C.
Szukam pomocy w zrozumieniu związku między x1, x2 i C.
Jeśli (jak sugerują niektórzy w odpowiedzi na moje pytanie) x2 działa jak zmienna tłumiąca dla x1, to jaki obszar na drugim schemacie Venna jest tłumiony?
Jeśli konkretny przykład byłby pomocny, możemy uznać x1 i x2 za dwie ludzkie umiejętności, a C za 4 lata GPA na studiach, 4 lata później.
Mam problem z wyobrażeniem sobie, jak zmienna supresorowa może spowodować powiększenie wyjaśnionej 8% wariancji dwóch r = .2 rzędu zerowego i wyjaśnienie 25% wariancji C. Konkretny przykład byłby bardzo pomocną odpowiedzią.