Próbuję zrozumieć pochodzenie zakrzywionych kształtów pasm ufności związanych z regresją liniową OLS i sposób, w jaki odnosi się to do przedziałów ufności parametrów regresji (nachylenie i przecięcie), na przykład (przy użyciu R):
require(visreg)
fit <- lm(Ozone ~ Solar.R,data=airquality)
visreg(fit)
Wydaje się, że pasmo jest powiązane z granicami linii obliczonymi z przecięciem 2,5% i nachyleniem 97,5%, a także z przecięciem 97,5% i nachyleniem 2,5% (choć nie do końca):
xnew <- seq(0,400)
int <- confint(fit)
lines(xnew, (int[1,2]+int[2,1]*xnew))
lines(xnew, (int[1,1]+int[2,2]*xnew))
Nie rozumiem dwóch rzeczy:
- Co z kombinacją nachylenia 2,5% i przechwytu 2,5%, a także nachylenia 97,5% i przechwytywania 97,5%? Dają one linie, które są wyraźnie poza pasmem wykreślonym powyżej. Może nie rozumiem znaczenia przedziału ufności, ale jeśli w 95% przypadków moje oszacowania mieszczą się w przedziale ufności, wydaje się, że to możliwy wynik?
- Co określa minimalną odległość między górną i dolną granicą (tj. Blisko punktu, w którym dwie linie dodane powyżej przechwytują)?
Wydaje mi się, że oba pytania powstają, ponieważ nie wiem / nie rozumiem, w jaki sposób te pasma są obliczane.
Jak obliczyć górną i dolną granicę za pomocą przedziałów ufności parametrów regresji (bez polegania na predykcji () lub podobnej funkcji, tj. Ręcznie)? Próbowałem rozszyfrować funkcję predykcji.lm w języku R, ale kodowanie jest poza mną. Będę wdzięczny za wszelkie wskazówki dotyczące odpowiedniej literatury lub wyjaśnień odpowiednich dla początkujących statystyk.
Dzięki.