Podczas gdy te dwa wszechobecne terminy są często używane jako synonimy, czasem wydaje się, że istnieje rozróżnienie. Czy rzeczywiście jest różnica, czy są one dokładnie synonimami?
Podczas gdy te dwa wszechobecne terminy są często używane jako synonimy, czasem wydaje się, że istnieje rozróżnienie. Czy rzeczywiście jest różnica, czy są one dokładnie synonimami?
Odpowiedzi:
Błędy dotyczą prawdziwego procesu generowania danych (MZD), podczas gdy resztki są pozostałością po oszacowaniu modelu. W rzeczywistości założenia takie jak normalność, homoscedastyczność i niezależność dotyczą błędów MZD, a nie resztek modelu. (Na przykład, mającparametry w twoim modelu, tylkoresztki N - ( p + 1 ) mogą być niezależne.) Mamy jednak dostęp tylko do reszt, więc nad tym pracujemy.
DGP
oznacza proces generowania danych . Nawet jeśli twój model jest odpowiedni i odzwierciedla prawdziwą strukturę MZD, reszty niekoniecznie będą normalne, homoscedastyczne i niezależne, jeśli nie leżą u podstaw błędy.
Błąd jest różnica między obserwowaną wartością a wartością rzeczywistą (bardzo często niedotrzymanego, generowanego przez DGP).
Resztkowy jest różnica między zmierzonym wartości i wartości przewidywanej (przez model).
Błąd jest pojęciem teoretycznym, którego nigdy nie można zaobserwować, ale reszta jest wartością rzeczywistą, obliczaną za każdym razem, gdy regresja jest wykonywana