Możliwy zakres


10

Załóżmy, że są to trzy szeregi czasowe, , iX1X2Y

Działa zwykły regresję liniową w ~ ( ), otrzymujemy . Zwyczajne regresji liniowej ~ uzyskać . Załóżmy, żeYX1Y=bX1+b0+ϵR2=UYX2R2=VU<V

Jakie są minimalne i maksymalne możliwe wartości przy regresji ~ ( )?R2YX1+X2Y=b1X1+b2X2+b0+ϵ

Uważam, że minimalna wartość powinna wynosić + mała wartość, ponieważ dodawanie nowych zmiennych zawsze zwiększa , ale nie wiem, jak obliczyć tę małą wartość, i nie wiem, jak uzyskać maksymalny zakres .R2VR2

Odpowiedzi:


9

1) Edycja: Komentarz Kardynała poniżej pokazuje, że prawidłowa odpowiedź do minimum pytanie . Dlatego usuwam moją „interesującą”, ale ostatecznie niepoprawną odpowiedź na tę część postu PO.R2V

2) Maksymalna wartość wynosi 1. Rozważ następujący przykład, który pasuje do twojego przypadku.R2

x1 <- rnorm(100)
x2 <- rnorm(100)
y <- x1 + 2*x2

> summary(lm(y~x1))$r.squared
[1] 0.2378023                 # This is U
> summary(lm(y~x2))$r.squared
[1] 0.7917808                 # This is V; U < V
> summary(lm(y~x1+x2))$r.squared
[1] 1

Tutaj ustalamy wariancję na 0. Jeśli chcesz , rzeczy się trochę zmieniają. Możesz uzyskać dowolnie blisko 1, zmniejszając , ale jak w przypadku minimalnego problemu, nie możesz się tam dostać, więc nie ma maksimum. 1 staje się supremum , ponieważ zawsze jest większe niż ale jest także granicą, ponieważ .ϵσϵ2>0R2σϵ2R2σϵ20


2
(+1) Niektóre komentarze: To dobra odpowiedź; To ciekawe, że wziąłeś się asymptotyczne podejście natomiast nie jest jasne, czy PO był zainteresowany tym, czy możliwe, jest stałym jeden (lub oba). Ta odpowiedź jest trochę niespójna z ograniczeniem OP, że , a jeśli lub dla niektórych , na przykład, wówczas minimalna dla wszystkie ustalone rozmiary próbek wynoszą dokładnie . (Przepraszam patologii tych przykładów.) Ponadto, OLS jest nie koniecznie zgodne nieobecne dodatkowe ograniczenia dotyczące czynników predykcyjnych. :)nU<VX1=0X1=a1aRR2V:=V(n)
kardynał

@ cardinal - przy ponownym czytaniu nie mogę zrozumieć, dlaczego podjąłem to podejście do problemu minimalnego, kiedy wydaje się teraz oczywistą poprawną odpowiedzią i, jak domyślnie zauważyłeś, mogłem skonstruować przykład, który osiąga to w żyła części maksymalnej ... no cóż, może moje espresso tego ranka przypadkowo było bezkofeinowe. (Może powinienem też dokładniej przejrzeć moje odpowiedzi przed opublikowaniem!)V
jbowman

Nie sądzę, że należy usunąć to, co napisałem, co ja zrobiłem znaleźć ciekawe podejście do odpowiedzi na pytanie! Chociaż wspomniane przeze mnie patologie z pewnością pozwalają na minimum , można się zastanawiać, co tak naprawdę oznacza . Drugi przykład może nie jest aż tak patologiczny, ponieważ w ogólnej wersji tego problemu rozciąga się na przypadek, w którym dowolny dodatkowy znajduje się w przestrzeni kolumn innych predyktorów. :)R2X1=0Xi
kardynał

1
@cardinal - dzięki! Zrekonstruuję to, może trochę bardziej formalnie, i odłożę na chwilę z powrotem na dół.
jbowman

5

Niech równa się korelację między i , równa się korelację między i i korelacji pomiędzy i . Następnie dla pełnego modelu podzielonego przez równa sięr1,2X1X2r1,YX1Yr2,YX2YR2V

(1(1r1,22))(12r1,2r1,Yr2,Y+UV).

Zatem dla pełnego modelu jest równe tylko wtedy, gdy i lubR2Vr1,2=0r1,Y2=U=0

r1,22=2r1,2r1,Yr2,YUV.

Jeśli , dla modelu pełnego równa .r1,2=0R2U+V


(+1) Urocze. Witamy na stronie. Rozważ zarejestrowanie konta, aby móc w pełni uczestniczyć. Później będę musiał przyjrzeć się temu wyrażeniu nieco bliżej. :)
kardynał

4

Bez ograniczeń dla i , minimum to , a następnie maksimum to mniejsze . Jest tak, ponieważ dwie części zmienne mogą być idealnie skorelowane (w tym przypadku dodanie drugą zmienną nie zmienia w ogóle) lub mogą być ortogonalne w którym to przypadku w tym zarówno powoduje . W komentarzach słusznie wskazano, że wymaga to również, aby każdy z nich był prostopadły do , wektora kolumny 1s.UVVmin(V+U,1)R2U+V1

Dodano ograniczenie . Nadal jednak możliwe jest, że . To znaczy, , w takim przypadku . Wreszcie możliwe jest, że więc górna granica to wciąż .U<VX1X2U=0X1Ymin=max=V+0X1X2min(V+U,1)

Jeśli wiedziałeś więcej o związku między i , myślę, że możesz powiedzieć więcej.X1X2


1
(+1) Należy jednak zauważyć, że nie jest (całkiem) prawdą, że jeśli i są ortogonalne, wówczas ich indywidualne wartości będą sumowane, gdy oba zostaną uwzględnione w modelu. Potrzebujemy także, aby były prostopadłe do wektora all-one . Pamiętaj, że możesz użyć na tej stronie do oznaczania matematyki. :)X1X2R21LATEX
kardynał

To prawda. Bardzo dziękuję za komentarze i za wskazanie, że można używać . Myślałem, że może, ale próbowałem ucieczki w stylu Mathjax (i [do wstawiania / równań. Pisanie tak, jakbym robił w TeXie działało jak urok :)LATEX
Joshua,
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.