Kontrolowanie czegoś i ignorowanie czegoś to nie to samo. Rozważmy wszechświat, w którym istnieją tylko 3 zmienne: , i . Chcemy zbudować model regresji, który przewiduje , i jesteśmy szczególnie zainteresowani jego relacją z . Istnieją dwie podstawowe możliwości. X 1 X 2 Y X 1YX1X2YX1
- Mogliśmy ocenić związek pomiędzy i , podczas sterowania na :
lub Y X 2 Y = β 0 + β 1 X 1 + β 2 X 2X1YX2
Y=β0+β1X1+β2X2
moglibyśmy ocenić związek między i , ignorując : Y X 2X1Y X2
Y=β0+β1X1
To prawda, są to bardzo proste modele, ale stanowią one różne sposoby patrzenia na to, jak relacje między i przejawia. Często szacowane s mogą być podobne w obu modelach, ale mogą być zupełnie inne. Najważniejsze w określeniu ich różnic jest relacja (lub jej brak) między i . Rozważ tę liczbę: Y β 1 X 1 X 2X1Yβ^1X1X2
W tym scenariuszu jest skorelowane z . Ponieważ wykres jest dwuwymiarowy, w pewnym sensie ignoruje (być może ironicznie), więc wskazałem wartości dla każdego punktu za pomocą różnych symboli i kolorów (poniższy wykres pseudo-3D zapewnia inny sposób próby wyświetlenia struktury danych). Jeśli dopasujemy model regresji, który ignoruje , otrzymamy ciągłą czarną linię regresji. Gdybyśmy dopasowali model, który kontrolował dla , otrzymalibyśmy płaszczyznę regresji, która znów jest trudna do wykreślenia, więc narysowałem trzy przekroje w tej płaszczyźnie, gdzie , , aX 2 X 2 X 2 X 2 X 2 X 2 = 1 X 2 = 2 X 2 = 3 X 1 Y X 2 X 2X1X2X2X2 X2X2X2=1X2=2X2=3. Tak więc, mamy linie, które pokazują związek między i , które posiadają kiedy kontrolować za . Warto zauważyć, że kontrolowanie nie daje ani jednej linii, ale zestawu linii. X1YX2 X2
Innym sposobem myślenia o rozróżnieniu między ignorowaniem i kontrolowaniem innej zmiennej jest rozważenie różnicy między rozkładem krańcowym a rozkładem warunkowym . Rozważ tę liczbę:
( To pochodzi z mojej odpowiedzi tutaj: jaka jest intuicja kryjąca się za warunkowymi rozkładami Gaussa? )
Jeśli spojrzeć na krzywą normalną poprowadzoną na lewo od głównego rysunku, który jest marginalny dystrybucja . Jest to dystrybucja jeśli ignorować jego relacje z . Na głównej figurze są dwie normalne krzywe reprezentujące rozkłady warunkowe gdy i . Rozkłady warunkowe kontrolują poziom , podczas gdy rozkład krańcowy go ignoruje . Y X Y X 1 = 25 X 1 = 45 X 1YYXYX1=25X1=45X1