Oferowane odpowiedzi dają mi kilka pomysłów na temat tego, co się tutaj dzieje. Wierzę, że mogły być jakieś błędy popełnione przez przypadek. Sprawdź, czy poniższa historia ma sens: Na początek myślę, że prawdopodobnie istnieje silny związek między X i Y w danych (oto trochę kodu i wykresu):
set.seed(5)
wage <- rlnorm(1000, meanlog=2.3, sdlog=.5)
something_else <- .7*wage + rnorm(1000, mean=0, sd=1)
plot(wage, something_else, pch=3, col="red", main="Plot X vs. Y")
Ale przez pomyłkę Y przewidywano tylko ze średniej. Łącząc to, reszty ze średniego modelu są wykreślane względem X, nawet jeśli zamierzano wykreślić względem dopasowanych wartości (kod i wykres):
meanModel <- lm(something_else~1)
windows()
plot(wage, meanModel$residuals, pch=3, col="red",
main="Plot of residuals from Mean only Model against X")
abline(h=0, lty="dotted")
Możemy to naprawić, dopasowując odpowiedni model i wykreślając z niego resztki (kod i wykres):
appropriateModel <- lm(something_else~wage)
windows()
plot(appropriateModel$fitted.values, appropriateModel$residuals, pch=3, col="red",
main="Plot of residuals from the appropriate\nmodel against fitted values")
lines(lowess(appropriateModel$residuals~appropriateModel$fitted.values))
Wydaje się, że to tylko takie głupstwa, które robiłem, kiedy zaczynałem.