Wyjaśnienie geometryczno-statystyczne.
Wyobraź sobie, że tworzysz wykres rozrzutu „na lewą stronę”, w którym podmiotami są osie, a zmienne i są punktami . Nazywa się to wykresem przestrzeni tematycznej (w przeciwieństwie do zwykłego wykresu zmiennej przestrzeni ). Ponieważ do wykreślenia są tylko 2 punkty, wszystkie wymiary w takim miejscu, z wyjątkiem dowolnych dwóch dowolnych wymiarów, które są w stanie obsłużyć 2 punkty plus początek, są zbędne i można je bezpiecznie upuścić. I tak zostaje nam samolot. Rysujemy strzałki wektora od początku do punktów: są to nasze zmienne i jako wektory w przestrzeni tematycznej danych.n 2 XYXY
Teraz, jeśli zmienne zostały wyśrodkowane, wówczas w przestrzeni przedmiotowej cosinus kąta między ich wektorami jest ich współczynnikiem korelacji . Na poniżej wektory i są ortogonalne: ich . Brak korelacji był warunkiem wstępnym nakreślonym przez @Dilip w ich odpowiedzi.XYr=0
Również w przypadku zmiennych wyśrodkowanych ich długości wektorowe w przestrzeni przedmiotowej są odchyleniami standardowymi . Na i są równej długości - równe wariancje były również warunkiem wstępnym @Dilip.XY
Aby narysować zmienną lub zmienną używamy po prostu dodawania lub odejmowania wektorów, o których zapomnieliśmy od czasów szkoły (przenieś wektor Y na koniec wektora X i odwróć kierunek w przypadku odejmowania - pokazuje to szara strzałka na zdjęciu - następnie narysuj wektor w miejscu, w którym wskazuje szara strzałka).X−YX+Y
Staje się bardzo jasne, że długość wektorów lub (odchylenie standardowe tych zmiennych) jest według twierdzenia Pitagorasa , a kąt między a lub wynosi 45 stopni, których cosinus - korelacja - wynosiX−YX+Y2σ2−−−√XX−YX+Y0.707...