Każdy pracowity uczeń jest kontrprzykładem dla „wszyscy uczniowie są leniwi”.
Jakie są proste kontrprzykłady na „jeśli zmienne losowe i są nieskorelowane, to są one niezależne”?
Każdy pracowity uczeń jest kontrprzykładem dla „wszyscy uczniowie są leniwi”.
Jakie są proste kontrprzykłady na „jeśli zmienne losowe i są nieskorelowane, to są one niezależne”?
Odpowiedzi:
Niech .
Niech .
Zmienne są nieskorelowane, ale zależne.
Alternatywnie, rozważ dyskretny rozkład dwuwymiarowy składający się z prawdopodobieństwa w 3 punktach (-1,1), (0, -1), (1,1) z prawdopodobieństwem odpowiednio 1/4, 1/2, 1/4. Następnie zmienne są nieskorelowane, ale zależne.
Rozważ dwuwymiarowe dane jednolite w rombie (kwadrat obrócony o 45 stopni). Zmienne będą nieskorelowane, ale zależne.
To są najprostsze przypadki, o których mogę myśleć.
Myślę, że istotę niektórych prostych kontrprzykładów można zobaczyć, rozpoczynając od ciągłej zmiennej losowej wyśrodkowanej na zero, tj. E [ X ] = 0 . Załóżmy, że pdf X jest parzysty i zdefiniowany w przedziale formy ( - a , a ) , gdzie a > 0 . Załóżmy teraz, że Y = f ( X ) dla niektórych funkcji f . Zadajemy teraz pytanie: dla jakich funkcji f ( X ) możemy mieć C o ?
Wiemy, że . Nasze założenie, że E [ X ] = 0 prowadzi nas prosto do C o v ( X , f ( X ) ) = E [ X f . Oznaczając pdf X za pomocą p ( ⋅ ) , mamy
.
Chcemy a jednym ze sposobów osiągnięcia tego jest zapewnienie, że f ( x ) jest funkcją parzystą, co oznacza, że x f ( x ) p ( x ) jest funkcją nieparzystą. Wynika z tego, że ∫ a - a x f ( x ) p ( x ) d x = 0 , a więc C o v .
W ten sposób widzimy, że dokładny rozkład jest nieważna jako wzdłuż jako pdf jest symetryczny wokół pewnym momencie i każdej nawet funkcja f ( ⋅ ) zrobi dla definiowania Y .
Mamy nadzieję, że pomoże to uczniom zobaczyć, jak ludzie wymyślają tego rodzaju kontrprzykłady.
Bądź kontrprzykładem (tj. Pracowity student)! Powiedziawszy to:
Próbowałem wymyślić przykład z prawdziwego świata i był to pierwszy, który przyszedł mi do głowy. Nie będzie to matematycznie najprostszy przypadek (ale jeśli zrozumiesz ten przykład, powinieneś być w stanie znaleźć prostszy przykład z urnami i piłkami lub coś takiego).
Według niektórych badań średnie IQ mężczyzn i kobiet jest takie samo, ale wariancja męskiego IQ jest większa niż wariancja kobiecego IQ. Dla konkretności, powiedzmy, że męskie IQ następuje po a żeńskie IQ następuje po N ( 100 , α σ 2 ) z α < 1 . Połowa populacji to mężczyźni, a połowa populacji to kobiety.
Zakładając, że to badanie jest poprawne:
Jaka jest korelacja płci i IQ?
Czy płeć i IQ są niezależne?
Możemy zdefiniować dyskretną zmienną losową z P ( X = - 1 ) = P ( X = 0 ) = P ( X = 1 ) = 1
a następnie zdefiniuj
Można łatwo zweryfikować, że i Y są nieskorelowane, ale nie niezależne.
Spróbuj tego (kod R):
x=c(1,0,-1,0);
y=c(0,1,0,-1);
cor(x,y);
[1] 0
Wynika to z równania koła
nie jest skorelowane z x , ale jest funkcjonalnie zależne (deterministyczne).
cor
funkcja zwracająca zero wskaże korelację populacji wynoszącą zero.
Jedynym ogólnym przypadkiem, gdy brak korelacji implikuje niezależność, jest to, że łączny rozkład X i Y ma charakter Gaussa.
Odpowiedź na dwa zdania: najjaśniejszym przypadkiem nieskorelowanej zależności statystycznej jest nieliniowa funkcja RV, powiedzmy Y = X ^ n. Dwa RV są wyraźnie zależne, ale nie są skorelowane, ponieważ korelacja jest relacją liniową.