W mojej głowie pojawiło się zamieszanie co do dwóch rodzajów estymatorów wartości populacji współczynnika korelacji Pearsona.
A. Fisher (1915) wykazał, że dla dwuwymiarowej populacji normalnej empiryczny jest negatywnie tendencyjnym estymatorem , chociaż odchylenie może być praktycznie znaczne tylko dla małej wielkości próby ( ). Próbka nie docenia w tym sensie, że jest bliższa niż . (Z wyjątkiem, gdy ten ostatni jest lub , bo wtedy jest bezstronna.) Kilka prawie pakietów estymatory z został zaproponowany, najlepszy prawdopodobnie będąc Olkin i Pratt (1958)n < 30 r ρ 0 ρ 0 ± 1 rpoprawione :
B. Mówi się, że w regresji przecenia odpowiednią populację R-kwadrat. Lub, przy prostej regresji, jest tak, że przecenia . W oparciu o ten fakt widziałem wiele tekstów mówiących, że jest pozytywnie stronniczy w stosunku do , co oznacza wartość bezwzględną: jest dalej od niż (czy to stwierdzenie jest prawdziwe?). Teksty mówią, że jest to ten sam problem, co przeszacowanie parametru odchylenia standardowego przez jego wartość próbki. Istnieje wiele formuł do „dostosowania” zaobserwowanego bliżej jego parametru populacji, Wherry's (1931)r 2 ρ 2 rr 0 ρ R 2 jest najbardziej znanym (ale nie najlepszym). Rdzeń takiego skorygowanego nazywa się skurczonym :
Obecne są dwa różne estymatory . Zupełnie inaczej: pierwszy nadmuchuje , drugi opróżnia . Jak je pogodzić? Gdzie użyć / zgłosić jedno, a gdzie - drugie?r r
W szczególności może być prawdą, że „skurczony” estymator jest również (prawie) bezstronny, podobnie jak „bezstronny”, ale tylko w innym kontekście - w asymetrycznym kontekście regresji. Bo czy w regresji OLS uważamy wartości jednej strony (predyktora) za ustalone, uczestnicząc bez przypadkowego błędu między próbkami? (I aby dodać tutaj, regresja nie wymaga dwuwymiarowej normalności.)