Bardzo często przyjmuje się, że tylko dane są obarczone błędem pomiaru (a przynajmniej, że jest to jedyny błąd, który będziemy brać pod uwagę). Ale ignoruje to możliwość i konsekwencje błędu w pomiarach . Może to być szczególnie dotkliwe w badaniach obserwacyjnych, w których zmienne nie podlegają kontroli eksperymentalnej.yxx
Rozrzedzenie regresji lub tłumienie regresji to zjawisko rozpoznane przez Spearmana (1904), w którym szacowane nachylenie regresji w prostej regresji liniowej jest tendencyjne do zera przez obecność błędu pomiaru w zmiennej niezależnej. Załóżmy, że prawdziwe nachylenie jest dodatnie - efektem drżeniawspółrzędnychpunktów(być może najłatwiej jest to wyobrazić jako „rozmazywanie” punktów w poziomie) jest to, że linia regresji jest mniej stroma. Intuicyjnie punkty z dużymsą teraz bardziej prawdopodobne ze względu na dodatni błąd pomiaru, podczas gdywartośćjest bardziej prawdopodobne, aby odzwierciedlać prawdziwą (wolną od błędów) wartość, a zatem jest niższa niż rzeczywista linia dla obserwowanychxxyxx .
W bardziej złożonych modelach błąd pomiaru w zmiennych może powodować bardziej skomplikowane skutki dla oszacowań parametrów. W modelach zmiennych występują błędy, które uwzględniają taki błąd. Spearman zasugerował współczynnik korygujący w celu zmniejszenia współczynników korelacji dwuwymiarowej, a dla bardziej wyrafinowanych sytuacji opracowano inne współczynniki korekcyjne. Jednak takie korekty mogą być trudne - szczególnie w przypadku wielowymiarowym i przy pomieszaniu - i może być kontrowersyjne, czy korekta jest prawdziwą poprawą, patrz np. Smith i Phillips (1996).x
Sądzę więc, że są to dwa nieporozumienia dotyczące ceny jednego - z jednej strony błędem jest myśleć, że sposób, w jaki piszemy oznacza „cały błąd jest w ” i ignoruje bardzo fizycznie realna możliwość błędów pomiaru w zmiennych niezależnych. Z drugiej strony, niewskazane może być ślepe stosowanie „korekt” dla błędu pomiaru we wszystkich takich sytuacjach, jak reakcja szarpnięcia kolana (choć może być dobrym pomysłem podjęcie kroków w celu zmniejszenia błędu pomiaru) .y=Xβ+εy
(Mam prawdopodobnie również odwołują się do innych modeli typowych błędów w-zmiennych, w coraz większym stopniu ogólnym kolejności: prostopadły regresji , regresji Deminga i całkowite najmniejszych kwadratów ).
Bibliografia