Streszczenie
Każde stwierdzenie w pytaniu może być rozumiane jako właściwość elips. Tylko nieruchomość szczególności z dwuwymiarowym rozkładzie normalnym, co jest potrzebne, jest fakt, że w standardowym dwuwymiarowym rozkładzie normalnym z --for którym X i Y są nieskorelowane - warunkowa wariancja Y nie zależy od X . (To z kolei jest bezpośrednią konsekwencją faktu, że brak korelacji implikuje niezależność dla zmiennych normalnych łącznie).X, YXYYX
Poniższa analiza pokazuje dokładnie, jaka właściwość elips jest zaangażowana, i wyprowadza wszystkie równania pytania za pomocą elementarnych pomysłów i najprostszej możliwej arytmetyki, w sposób, który można łatwo zapamiętać.
Rozkłady symetryczne kołowo
Rozkład pytania jest członkiem rodziny dwuwymiarowych rozkładów normalnych. Wszystkie pochodzą od podstawowego elementu, standardowej dwuwymiarowej normalnej, która opisuje dwa nieskorelowane standardowe rozkłady normalne (tworzące dwie współrzędne).
Lewa strona to wykres reliefowy standardowej dwuwymiarowej normalnej gęstości. Prawa strona pokazuje to samo w pseudo-3D, z wyciętą przednią częścią.
Jest to przykład kołowo-symetrycznego rozkładu: gęstość zmienia się wraz z odległością od centralnego punktu, ale nie z kierunkiem oddalonym od tego punktu. Zatem kontury jego wykresu (po prawej) są okręgami.
Większość innych dwuwymiarowych rozkładów normalnych nie jest jednak kołowo symetrycznych: ich przekroje są elipsami. Te elipsy modelują charakterystyczny kształt wielu dwuwymiarowych chmur punktów.
Są to portrety dwuwymiarowego rozkładu normalnego z macierzą kowariancji Jest to model danych z współczynnikiem korelacji-2/3.Σ = ( 1- 23)- 23)1) .- 2 / 3
Jak tworzyć elipsy
Elipsa - zgodnie z jej najstarszą definicją - jest sekcją stożkową, która jest okręgiem zniekształconym przez rzut na inną płaszczyznę. Biorąc pod uwagę naturę projekcji, tak jak robią to artyści wizualni, możemy ją rozłożyć na sekwencję zniekształceń, które są łatwe do zrozumienia i obliczenia.
Najpierw rozciągnij (lub, jeśli to konieczne, ściśnij) okrąg wzdłuż tego, co stanie się długą osią elipsy, aż uzyska odpowiednią długość:
Następnie ściśnij (lub rozciągnij) tę elipsę wzdłuż jej mniejszej osi:
Po trzecie, obróć go wokół środka do ostatecznego ustawienia:
Na koniec przenieś go w wybrane miejsce:
To wszystko są afiniczne transformacje. (W rzeczywistości pierwsze trzy są transformacjami liniowymi ; ostatnie przesunięcie sprawia, że afinuje.) Ponieważ skład transformacji afinicznych jest (z definicji) wciąż afiniczny, zniekształcenie netto od koła do końcowej elipsy jest transformacją afiniczną. Ale może to być nieco skomplikowane:
Zwróć uwagę na to, co stało się z (naturalnymi) osiami elipsy: po utworzeniu przez przesunięcie i ściśnięcie, (oczywiście) obróciły się i przesunęły wraz z samą osią. Z łatwością widzimy te osie, nawet jeśli nie są narysowane, ponieważ są one osiami symetrii samej elipsy.
Chcielibyśmy zastosować nasze rozumienie elips do zrozumienia zniekształconych kołowo symetrycznych rozkładów, takich jak dwuwymiarowa rodzina Normal. Niestety, nie ma problemu z tymi zakłóceniami : oni nie szanują rozróżnienie między i y osi. Rotacja w kroku 3 rujnuje to. Spójrz na słabym współrzędnych siatek w środowisk: te pokazują, co dzieje się z siatki (siatki 1 / 2xy1/2w obu kierunkach), gdy jest zniekształcony. Na pierwszym zdjęciu odstęp między oryginalnymi pionowymi liniami (pokazanymi jako ciągłe) jest podwojony. Na drugim zdjęciu odstęp między oryginalnymi poziomymi liniami (pokazanymi przerywanymi) zmniejsza się o jedną trzecią. Na trzecim zdjęciu odstępy między siatkami nie są zmieniane, ale wszystkie linie są obracane. Przesuwają się w górę i w prawo na czwartym zdjęciu. Ostateczny obraz, pokazujący wynik netto, pokazuje tę rozciągniętą, ściśniętą, obróconą, przesuniętą siatkę. Oryginalne linie ciągłe o stałej współrzędnej nie są już pionowe.x
Kluczową ideą - można zaryzykować stwierdzenie, że jest to sedno regresji - jest sposób, w jaki okrąg można zniekształcić w elipsę bez obracania linii pionowych . Ponieważ przyczyną była rotacja, przejdźmy do sedna sprawy i pokażmy, jak stworzyć obróconą elipsę, bez faktycznego obracania czegokolwiek !
To jest transformacja skośna. W rzeczywistości robi dwie rzeczy naraz:
Ściska w kierunku ( powiedzmy o wartość λ ). To pozostawia oś X w spokoju.yλx
Podnosi każdy wynikowy punkt o kwotę wprost proporcjonalną do x . Zapisując tę stałą proporcjonalności jako ρ , wysyła ( x , y ) do ( x , y + ρ x ) .(x,y)xρ(x,y)(x,y+ρx)
Drugi krok podnosi oś do linii y = ρ x , jak pokazano na poprzednim rysunku. Jak pokazano na tym rysunku, chcę pracować ze specjalną transformacją pochylenia, która skutecznie obraca elipsę o 45 stopni i wpisuje ją w kwadrat jednostki. Główną osią tej elipsy jest linia y = x . Jest wizualnie oczywiste, że | ρ | ≤ 1 . (Ujemne wartości ρ przechylają elipsę w prawo, a nie w prawo.) To geometryczne wyjaśnienie „regresji do średniej”.xy=ρxy=x|ρ|≤1ρ
Wybranie kąta 45 stopni powoduje, że elipsa jest symetryczna wokół przekątnej kwadratu (część linii ). Aby obliczyć parametry tej transformacji skośnej, obserwuj:y=x
Podnoszenie o przesuwa punkt ( 1 , 0 ) do ( 1 , ρ ) .ρx(1,0)(1,ρ)
Symetria wokół głównej przekątnej oznacza, że punkt również leży na elipsie.(ρ,1)
Gdzie zaczął się ten punkt?
Pierwotny (górny) punkt na okręgu jednostkowym (mający równanie niejawne ) o współrzędnej x ρ wynosił ( ρ , √x2+y2=1xρ.(ρ,1−ρ2−−−−−√)
Dowolny punkt formy najpierw został ściśnięty do ( ρ , λ y ), a następnie podniesiony do ( ρ , λ y + ρ × ρ ) .(ρ,y)(ρ,λy)(ρ,λy+ρ×ρ)
Unikalne rozwiązanie równania toλ= √(ρ,λ1−ρ2−−−−−√+ρ2)=(ρ,1) . Jest to wielkość, o którą wszystkie odległości w kierunku pionowym muszą zostać ściśnięte, aby utworzyć elipsę pod kątem 45 stopni, gdy jest ona przekrzywiona w pionie oρ.λ=1−ρ2−−−−−√ρ
ρ0, 3/10, 6/10,9/10,
ρ
Podanie
Jesteśmy gotowi na regresję. Standardową, elegancką (ale prostą) metodą regresji jest najpierw wyrażenie oryginalnych zmiennych w nowych jednostkach miary: skupiamy je na ich średnich wartościach i używamy ich standardowych odchyleń jako jednostek. To przesuwa środek rozkładu do początku i powoduje, że wszystkie jego eliptyczne kontury są nachylone o 45 stopni (w górę lub w dół).
x0x0y1−ρ2−−−−−√ρxρxx
xy=ρx
x
Możemy łatwo powiedzieć więcej:
1x1−ρ2
ρΣXYXYXY(X,Y)
ε=Y−ρX
ε0Y0ρXρX
xρ=−1/2
w konsekwencji
E(XY)=E(X(ρX+ε))=ρE(X2)+E(Xε)=ρ(1)+0=ρ.
X1XεX(−ε)ε0
ρXY
Wnioski
x(X,Y)xyμxμyσxσy
(μx,μy)
{(x,ρx)},
ρσyρ/σx
W związku z tym równanie linii regresji jest
y=σyρσx(x−μx)+μy.
- Y|Xσ2y(1−ρ2)Y′|X′(X′,Y′)X′=(X−μX)/σxY′=(Y−μY)/σY
Y′|X′1
- Σσ11=σ2x, σ12=σ21=ρσxσy,σ22=σ2y,Y|X
σ2y(1−ρ2)=σ22(1−(σ12σ11σ22−−−−−√)2)=σ22−σ212σ11.
Uwagi techniczne
y
(1ρρ1)=AA′
gdzie
A=(1ρ01−ρ2−−−−−√).
O wiele lepiej znanym pierwiastkiem kwadratowym jest ten opisany początkowo (obejmujący obrót zamiast transformacji skośnej); jest to ten powstały w wyniku rozkładu pojedynczej wartości i odgrywa znaczącą rolę w analizie głównych składników (PCA):
(1ρρ1)=BB′;
B=Q(ρ+1−−−−√001−ρ−−−−√)Q′
Q=⎛⎝12√12√−12√12√⎞⎠45
Zatem różnica między PCA a regresją sprowadza się do różnicy między dwoma specjalnymi pierwiastkami kwadratowymi macierzy korelacji.