Co oznacza „wszystko inne równe” w regresji wielokrotnej?


22

Kiedy wykonujemy wiele regresji i mówimy, że patrzymy na średnią zmianę zmiennej dla zmiany zmiennej , utrzymując wszystkie pozostałe zmienne na stałym poziomie, na jakich wartościach utrzymujemy inne zmienne jako stałe? Ich średni? Zero? Dowolna wartość?yx

Jestem skłonny myśleć, że to ma jakąkolwiek wartość; tylko szukam wyjaśnień. Gdyby ktoś miał dowód, to też byłoby świetnie.


2
Przykład 10 w pracy Petera Kennedy'ego był bardzo pomocny w zrozumieniu tego.
Dimitriy V. Masterov

Tak, kwestia zwiększenia liczby pokoi przy utrzymaniu stałej stopy kwadratowej jest naprawdę spostrzegawczym punktem. Ten papier jest w rzeczywistości kopalnią przydatnych pomysłów, będzie w notatkach doktora.
EconStats

1
To właściwie bardzo interesujące pytanie, zastanawiam się, czy ekonomiści zadają sobie pytanie, co dokładnie znaczy „ceteris paribus”.
mugen

Odpowiedzi:


26

Masz rację. Technicznie jest to dowolna wartość . Jednakże, kiedy uczę tego, zwykle mówię ludziom, że otrzymujesz efekt zmiany jednej jednostki w gdy wszystkie inne zmienne są utrzymywane na ich odpowiednich . Uważam, że jest to powszechny sposób na wyjaśnienie tego, co nie jest dla mnie specyficzne. Xj

Zazwyczaj że jeśli nie masz żadnych interakcji, będzie efektem zmiany jednej jednostki w , bez względu na wartości innych zmiennych. Ale lubię zaczynać od przeciętnego sformułowania. Powodem są dwa efekty włączenia wielu zmiennych do modelu regresji. Po pierwsze, otrzymujesz efekt kontrolowania dla innych zmiennych (patrz moja odpowiedź tutaj ). Drugi polega na tym, że obecność innych zmiennych (zwykle) zmniejsza resztkową wariancję modelu, tworząc twoje zmienne (w tymX j X j X j XβjXjXjXj) 'bardziej znaczący'. Ludziom trudno jest zrozumieć, jak to działa, jeśli inne zmienne mają wartości, które są wszędzie. Wygląda na to, że zwiększyłoby to zmienność. Jeśli myślisz o dostosowaniu każdego punktu danych w górę lub w dół o wartość każdej innej zmiennej, dopóki wszystkie pozostałe zmienne nie zostaną przeniesione do odpowiednich wartości, łatwiej jest zauważyć, że zmienność resztkowa została zmniejszona. X

Nie wchodzę w interakcje, dopóki klasa lub dwie po wprowadzeniu podstaw regresji wielokrotnej. Jednak kiedy do nich docieram, wracam do tego materiału. Powyższe stosuje się, gdy nie ma interakcji. Kiedy występują interakcje, jest to bardziej skomplikowane. W takim przypadku zmienne oddziałujące [s] są utrzymywane na stałym poziomie (bardzo konkretnie) na poziomie i na żadnej innej wartości. 0

Jeśli chcesz zobaczyć, jak to wygląda algebraicznie, jest to raczej proste. Możemy zacząć od przypadku braku interakcji. Określmy zmianę w gdy wszystkie inne zmienne są utrzymywane na stałym poziomie w odpowiednich środkach. Bez utraty ogólności, powiedzmy, że istnieją trzy zmienne i jesteśmy zainteresowani zrozumieniem, w jaki sposób zmiana jest powiązana ze zmianą jednej jednostki w , utrzymując i stałym poziomie: X Y X3X1X2Y^XY^X3X1X2

Y^i=β^0+β^1X¯1+β^2X¯2+β^3X3iY^i=β^0+β^1X¯1+β^2X¯2+β^3(X3i+1) subtracting the first equation from the second: Y^iY^i=β^0β^0+β^1X¯1β^1X¯1+β^2X¯2β^2X¯2+β^3(X3i+1)β^3X3iΔY=β^3X3i+β^3β^3X3iΔY=β^3

Teraz jest oczywiste, że moglibyśmy umieścić dowolną wartość dla i w pierwszych dwóch równaniach, pod warunkiem, że wstawimy tę samą wartość dla ( ) w obu z nich. To znaczy, dopóki trzymamy i stałą . X 2X1X2X 2 X 1 X 2X1X2X1X2

Z drugiej strony nie działa to w ten sposób, jeśli masz interakcję. Tutaj pokazuję przypadek, w którym występuje termin interakcji : X1X3

Y^i=β^0+β^1X¯1+β^2X¯2+β^3X3i +β^4X¯1X3iY^i=β^0+β^1X¯1+β^2X¯2+β^3(X3i+1)+β^4X¯1(X3i+1) subtracting the first equation from the second: Y^iY^i=β^0β^0+β^1X¯1β^1X¯1+β^2X¯2β^2X¯2+β^3(X3i+1)β^3X3i+ β^4X¯1(X3i+1)β^4X¯1X3iΔY=β^3X3i+β^3β^3X3i+β^4X¯1X3i+β^4X¯1β^4X¯1X3iΔY=β^3+β^4X¯1

W takim przypadku nie jest możliwe utrzymanie stałej wartości wszystkich pozostałych. Ponieważ termin interakcji jest funkcją i , zmiana nie jest możliwa bez zmiany terminu interakcji. Zatem równa się zmianie związanej ze zmianą jednej jednostki w tylko wtedy, gdy zmienna interakcji ( ) jest utrzymywana na poziomie zamiast (lub dowolnej innej wartości poza ), w którym to przypadku ostatni termin w dolnym równaniu odpada. X 3 X 3X1X3X3 Y X3X10 ˉ X 10β^3Y^X3 X10X¯10

W tej dyskusji skupiłem się na interakcjach, ale bardziej ogólnie problem polega na tym, że jest jakaś zmienna będąca funkcją innej, tak że nie można zmienić wartości pierwszej bez zmiany odpowiedniej wartości drugiej zmiennej . W takich przypadkach znaczenie staje się bardziej skomplikowane. Na przykład, jeśli miałeś model z i , to jest pochodną utrzymującą wszystkie pozostałe równe i posiadającą (patrz moja odpowiedź tutaj ). Możliwe są również inne, jeszcze bardziej skomplikowane formulacje. XJX 2 Jβ^jXjXj2dYβ^j Xj=0dYdXjXj=0


1
Dzięki Gung, ta odpowiedź jest świetna na kilku poziomach. Po pierwsze odpowiada na główny punkt, który mnie interesował. Po drugie, przewidziałeś, jakie będzie moje dalsze pytanie, ponieważ zamierzałem zapytać, jak to się zmieniło wraz z wprowadzeniem warunków interakcji. Dziękuję również za matematykę. Wiem, że to pytanie jest dość podstawowe, ale uważam, że z tymi pojęciami nigdy nie możesz być zbyt jednoznaczny.
EconStats

Nie ma za co, @EconStats. Nie ma problemu z włączeniem matematyki, czasem znacznie łatwiej jest zrozumieć, co się dzieje.
Gung - Przywróć Monikę

Cóż, muszę powiedzieć, że odjęcie pierwszego równania od drugiego równania ostatecznie potwierdziło moje oryginalne myśli, że nie ma znaczenia, jakie są wartości i , o ile są one takie same w obu równaniach. Wydaje mi się to oczywiste, ale nigdy wcześniej nie myślałem o obliczeniu ten sposób. Zdecydowany moment dla mnie. X2 βX3β
EconStats

Możesz także wziąć pochodną wrt i przeniesie Cię w to samo miejsce, ale jest to łatwiejsza matematyka (zasadniczo algebra dla szkół średnich), więc będzie dostępna dla szerszej publiczności. X jYXj
Gung - Przywróć Monikę

1
@ Beetroot, jeśli dobrze cię rozumiem, po prostu trzymasz go na określonym poziomie. (W przeciwnym razie możesz zadać to jako nowe pytanie.)
Gung - Przywróć Monikę

8

Matematyka jest prosta, wystarczy wziąć różnicę między 2 modelami z jedną zmienną x zmienioną o 1, a zobaczysz, że nie ma znaczenia, jakie są inne zmienne (pod warunkiem, że nie ma interakcji, wielomianu lub innych skomplikowanych terminów).

Jeden przykład:

y[1]=b0+b1×x1+b2×x2

y[2)]=b0+b1×(x1+1)+b2)×x2)

y[2)]-y[1]=b0-b0+b1×x1-b1×x1+b1×1+b2)×x2)-b2)×x2)=b1


6

Uważam, że masz na myśli zależność w zmiennych towarzyszących ( ). Więc jeśli modelem jest wpływ na wszystkie pozostałe rzeczy będą równe to dla dowolnego z wszystkimi innymi utrzymywanymi stałymi na dowolnej wartości.Xja

Y=β0+β1X1+β2)X2)
XjaYΔYΔXjaΔXjaXjot

Należy pamiętać, że możliwe jest, że i są zależne (np. Funkcje od siebie), niekoniecznie wykazując znaczącą interakcję w modelu liniowym ( w ).X 2X1X2)β12=0Y=β0+β1X1+β2)X2)+β12X1X2)

Ciekawą styczną jest tutaj przykład: Niech i to oczywiście każda zmiana w wpłynie na . Jednak kowariancja między nimi wynosi zero. X 2 = X 2 1 + N ( 0 , σ 2 2 ) X 1X1N.(0,σ12))X2)=X12)+N.(0,σ2)2))X1X2)

doov(X1,X2))=mi(X1X2))-mi(X1)mi(X2))
= E ( X 3 1 ) - E ( X 1 . ) - 0 E ( x 2 1 - ) = 0 - 0 - 0 = 0
=mi[X1(X12)+za)]-mi(X1).mi(X12)-za)wjathzaN.(0,σ2)2))
=mi(X13))-mi(X1.za)-0.mi(X12)-za)=0-0-0=0

Tak więc w rzeczywistości zmiana byłaby powiązana ze zmianą a nie obejmowałoby tego, co naprawdę by się stało, gdybyś zmienił . Ale nadal byłby opisywany jako wpływ na wszystkich rzeczy równych.X 2 Δ YX1X2) X1ÆYΔYΔXjaX1 XiYΔYΔXjaXjaY

Jest to porównywalne z różnicą między pochodną pełną a pochodną cząstkową (analogiem ) w równaniu różniczkowym. ΔYΔXja


Dzięki Hans, tak naprawdę próbowałem dojść do punktu, w którym powstał Gung, ale jest to dobry przykład, kiedy dwie zmienne są zależne.
EconStats
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.