Pytania otagowane jako r-squared

Współczynnik determinacji, zwykle symbolizowany przez R2), to odsetek całkowitej wariancji odpowiedzi wyjaśnionej przez model regresji. Może być również stosowany do różnych proponowanych pseudo-kwadratów R, na przykład do regresji logistycznej (i innych modeli).

1
Oczekiwana wartość , współczynnik determinacji, pod hipotezą zerową
Jestem ciekawy stwierdzenia dokonanego na dole pierwszej strony tego tekstu dotyczącego korektyR2adjustedRadjusted2R^2_\mathrm{adjusted} R2adjusted=1−(1−R2)(n−1n−m−1).Radjusted2=1−(1−R2)(n−1n−m−1).R^2_\mathrm{adjusted} =1-(1-R^2)\left({\frac{n-1}{n-m-1}}\right). Tekst stanowi: Logika korekty jest następująca: w zwykłej regresji wielokrotnej predyktor losowy wyjaśnia średnio proporcję 1/(n–1)1/(n–1)1/(n – 1) zmiany odpowiedzi, tak że mmm losowych predyktorów wyjaśnia razem, średnio m/(n–1)m/(n–1)m/(n – 1) wariantu odpowiedzi; innymi słowy, oczekiwana …

3
Czy korelacja lub współczynnik determinacji odnoszą się do odsetka wartości, które mieszczą się wzdłuż linii regresji?
Korelacja jest miarą liniowego powiązania między dwiema zmiennymi. Współczynnik determinacji, , jest miarą tego, jak dużą zmienność jednej zmiennej można „wyjaśnić” zmiennością drugiej.r 2rrrr2)r2r^2 Na przykład, jeśli jest korelacją między dwiema zmiennymi, to . Stąd 64% zmienności w jednym z nich można wytłumaczyć różnicami w drugim. Dobrze?r 2 = 0,64r …

3
Czy mój model jest dobry na podstawie wartości metryki diagnostycznej ( / AUC / dokładność / RMSE itp.)?
Dopasowałem swój model i staram się zrozumieć, czy jest on dobry. Obliczyłem zalecane miary, aby je ocenić ( / AUC / dokładność / błąd prognozowania itp.), Ale nie wiem, jak je interpretować. Krótko mówiąc, jak stwierdzić, czy mój model jest dobry na podstawie danych? Czy 0,6 (na przykład) wystarcza, abym …


1
Należy częściowy
Oto model utworzony z mtcarszestawu danych: > ols(mpg~wt+am+qsec, mtcars) Linear Regression Model ols(formula = mpg ~ wt + am + qsec, data = mtcars) Model Likelihood Discrimination Ratio Test Indexes Obs 32 LR chi2 60.64 R2 0.850 sigma 2.4588 d.f. 3 R2 adj 0.834 d.f. 28 Pr(> chi2) 0.0000 g …



3
Jak uzyskać przedział ufności dla zmiany r-kwadratowej populacji
Dla prostego przykładu załóżmy, że istnieją dwa modele regresji liniowej 1 Model posiada trzy czynniki prognostyczne, x1a, x2b, ix2c Model 2 ma trzy predyktory z modelu 1 i dwa dodatkowe predyktory x2aorazx2b Istnieje równanie regresji populacji, w którym wyjaśniona wariancja populacji wynosi ρ2(1)ρ(1)2\rho^2_{(1)} dla Modelu 1 i ρ2(2)ρ(2)2\rho^2_{(2)} dla Modelu …

1
Dodanie predyktora regresji liniowej zmniejsza R do kwadratu
Mój zestaw danych (N.≈ 10 , 000N.≈10,000N \approx 10,000) ma zmienną zależną (DV), pięć niezależnych zmiennych „podstawowych” (P1, P2, P3, P4, P5) i jedną niezależną zmienną będącą przedmiotem zainteresowania (Q). Uruchomiłem regresje liniowe OLS dla następujących dwóch modeli: DV ~ 1 + P1 + P2 + P3 + P4 + …

1
Dlaczego nie możemy użyć
Wyobraź sobie, że mamy model regresji liniowej ze zmienną zależną yyy. Znajdziemy toR2)yRy2R^2_y. Teraz wykonujemy kolejną regresję, ale tym razemlog( y)log⁡(y)\log(y)i podobnie znajdź R2)log( y)Rlog⁡(y)2R^2_{\log(y)}. Powiedziano mi, że nie mogę porównać obuR2)R2R^2aby zobaczyć, który model jest bardziej odpowiedni. Dlaczego? Podany mi powód był taki, że będziemy porównywać zmienność różnych wielkości …

1
Jak obliczyć z kwadratu próbki R?
Wiem, że prawdopodobnie zostało to omówione gdzie indziej, ale nie udało mi się znaleźć jednoznacznej odpowiedzi. Próbuję użyć wzoru aby obliczyć poza próbą modelu regresji liniowej, gdzie jest sumą kwadratów reszt, a jest sumą kwadratów. W przypadku zestawu treningowego jasne jest, żeR2=1−SSR/SSTR2=1−SSR/SSTR^2 = 1 - SSR/SSTR2R2R^2SSRSSRSSRSSTSSTSST SST=Σ(y−y¯train)2SST=Σ(y−y¯train)2 SST = \Sigma …


2
Czy istnieje elegancki / wnikliwy sposób zrozumienia tej tożsamości regresji liniowej dla wielu ?
W regresji liniowej doszedłem do cudownego wyniku, jeśli dopasujemy model E[Y]=β1X1+β2X2+c,E[Y]=β1X1+β2X2+c,E[Y] = \beta_1 X_1 + \beta_2 X_2 + c, to jeśli znormalizujemy i wyśrodkujemy dane , i ,YYYX1X1X_1X2X2X_2 R2=Cor(Y,X1)β1+Cor(Y,X2)β2.R2=Cor(Y,X1)β1+Cor(Y,X2)β2.R^2 = \mathrm{Cor}(Y,X_1) \beta_1 + \mathrm{Cor}(Y, X_2) \beta_2. Wydaje mi się, że jest to zmienna wersja dla regresji , co jest przyjemne.R2=Cor(Y,X)2R2=Cor(Y,X)2R^2 …

5
Czy używanie decyli do znalezienia korelacji jest statystycznie poprawnym podejściem?
Mam próbkę 1449 punktów danych, które nie są skorelowane (r-kwadrat 0,006). Analizując dane, odkryłem, że dzieląc wartości zmiennych niezależnych na grupy dodatnie i ujemne, wydaje się, że istnieje znacząca różnica w średniej zmiennej zależnej dla każdej grupy. Dzieląc punkty na 10 przedziałów (decyli) przy użyciu niezależnych wartości zmiennych, wydaje się, …

3
Możliwy zakres
Załóżmy, że są to trzy szeregi czasowe, , iX1X1X_1X2X2X_2YYY Działa zwykły regresję liniową w ~ ( ), otrzymujemy . Zwyczajne regresji liniowej ~ uzyskać . Załóżmy, żeYYYX1X1X_1Y=bX1+b0+ϵY=bX1+b0+ϵY = b X_1 + b_0 + \epsilonR2=UR2=UR^2 = UYYYX2X2X_2R2=VR2=VR^2 = VU&lt;VU&lt;VU < V Jakie są minimalne i maksymalne możliwe wartości przy regresji ~ …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.