Pięć punktów podsumowania
tak, chodzi o szybkie podsumowanie dystrybucji. Powinna być w przybliżeniu symetryczna względem średniej, mediana powinna być bliska 0, wartości 1Q i 3Q powinny idealnie być mniej więcej podobnymi wartościami.
Współczynniki iβi^s
Każdy współczynnik w modelu jest losową zmienną Gaussa (normalną). jest oszacowanie średniej rozkładu tej zmiennej losowej, a błąd standardowy jest pierwiastek kwadratowy z wariancji tego rozkładu. Jest to miara niepewności w oszacowaniu .βi^βi^
Możesz sprawdzić, w jaki sposób są one obliczane (a także stosowane wzory matematyczne) na Wikipedii . Zauważ, że żaden szanujący się program statystyczny nie użyje standardowych równań matematycznych do obliczenia ponieważ wykonanie ich na komputerze może prowadzić do dużej utraty precyzji obliczeń.βi^
t -statystyka
W statystyczne są szacunkowe ( ) podzielona przez błędy standardowe ( ), np . Zakładając, że masz ten sam model w obiekcie co twoje Q:tβi^σi^ti=βi^σi^mod
> mod <- lm(Sepal.Width ~ Petal.Width, data = iris)
następnie raporty wartości R są obliczane jako:t
> tstats <- coef(mod) / sqrt(diag(vcov(mod)))
(Intercept) Petal.Width
53.277950 -4.786461
Gdzie coef(mod)
jest i podaje pierwiastki kwadratowe diagonalnych elementów macierzy kowariancji parametrów modelu, które są standardowymi błędami parametrów ( ).βi^sqrt(diag(vcov(mod)))
σi^
Wartość p jest prawdopodobieństwem osiągnięcia atak duża jak lub większa niż zaobserwowana bezwzględna wartość t, jeśli hipoteza ( ) była prawdziwa, gdzie wynosi . Są one obliczane jako (używając z góry):|t|H0H0βi=0tstats
> 2 * pt(abs(tstats), df = df.residual(mod), lower.tail = FALSE)
(Intercept) Petal.Width
1.835999e-98 4.073229e-06
Tak więc obliczamy prawdopodobieństwo osiągnięcia górnego ogona dla wartości , które zrobiliśmy z rozkładu przy stopniach swobody równych pozostałym stopniom swobody modelu. To reprezentuje prawdopodobieństwo osiągnięcia wartości większej niż wartości bezwzględne obserwowanych s. Mnoży się ją przez 2, ponieważ oczywiście może być również duże w kierunku ujemnym.ttttt
Błąd resztkowy standardowy
Resztkowy błąd standardowy jest oszacowaniem parametru . Przy założeniu, w normalnych najmniejszych kwadratów, że reszty indywidualnie opisany przez (normalny) rozkład Gaussa, ze średnią i odchylenie standardowe 0 . dotyczy stałej wariancji założeniu; każda reszta ma tę samą wariancję i ta wariancja jest równa .σσσσ2
SkorygowanoR2
Skorygowane oblicza się jako:R2
1−(1−R2)n−1n−p−1
Skorygowany jest taki sam jak , ale dostosowany do złożoności (tj. Liczby parametrów) modelu. Biorąc pod uwagę model z jednym parametrem, z pewnym , jeśli dodamy kolejny parametr do tego modelu, nowego modelu musi wzrosnąć, nawet jeśli dodany parametr nie ma mocy statystycznej. Skorygowane uwzględnia to, włączając liczbę parametrów do modelu.R2R2R2R2R2
F statystyki
jest stosunek dwóch wariancji ( ), wariancja wyjaśnionego parametrów modelu (suma kwadratów z regresją SSR) oraz pozostałości lub niewyjaśnionej wariancji (suma kwadratów błędów, SSE). Możesz to lepiej zobaczyć, jeśli otrzymamy tabelę ANOVA dla modelu poprzez :FSSR/SSEanova()
> anova(mod)
Analysis of Variance Table
Response: Sepal.Width
Df Sum Sq Mean Sq F value Pr(>F)
Petal.Width 1 3.7945 3.7945 22.91 4.073e-06 ***
Residuals 148 24.5124 0.1656
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
W y są takie same, na wyjściu ANOVA i wyjściu. Kolumna zawiera dwa odchylenia i . Możemy obliczyć prawdopodobieństwo uzyskania wartości tak dużej przy zerowej hipotezie braku efektu, na podstawie rozkładu o 1 i 148 stopniach swobody. To jest zgłaszane w ostatniej kolumnie tabeli ANOVA. W prostym przypadku pojedynczego, ciągłego predyktora (jak w twoim przykładzie) , dlatego wartości p są takie same. Ta równoważność obowiązuje tylko w tym prostym przypadku.F3,7945 / 0,1656 = 22,91 F F F = t 2 P e t a l . W i d t hsummary(mod)
Mean Sq
3.7945/0.1656=22.91FFF=t2Petal.Width