Chciałbym wykonać test W Shapiro Wilka i test Kołmogorowa-Smirnowa na resztkach modelu liniowego w celu sprawdzenia normalności. Zastanawiałem się tylko, jakie resztki powinny być do tego użyte - surowe resztki, resztki Pearsona, resztki studenckie czy resztki standaryzowane? Dla testu W Shapiro-Wilka wydaje się, że wyniki dla reszt surowych i Pearsona są identyczne, ale nie dla innych.
fit=lm(mpg ~ 1 + hp + wt, data=mtcars)
res1=residuals(fit,type="response")
res2=residuals(fit,type="pearson")
res3=rstudent(fit)
res4=rstandard(fit)
shapiro.test(res1) # W = 0.9279, p-value = 0.03427
shapiro.test(res2) # W = 0.9279, p-value = 0.03427
shapiro.test(res3) # W = 0.9058, p-value = 0.008722
shapiro.test(res4) # W = 0.9205, p-value = 0.02143
To samo pytanie dla KS, a także czy resztki powinny być testowane względem rozkładu normalnego (pnorm) jak w
ks.test(res1, "pnorm") # D = 0.296, p-value = 0.005563
lub rozkład t-student z nk-2 stopniami swobody, jak w
ks.test(res3, "pt",df=nrow(mtcars)-2-2)
Może jakaś rada? Jakie są zalecane wartości dla statystyk testowych W (> 0,9?) I D, aby rozkład był wystarczająco zbliżony do normalności i nie wpływał zbytnio na twoje wnioskowanie?
Wreszcie, czy to podejście uwzględnia niepewność w dopasowanych współczynnikach lm, czy może lepiej byłoby pod tym względem funkcjonować cumres()
w pakiecie gof()
?
na zdrowie, Tom