Jeśli mamy 2 normalne, nieskorelowane zmienne losowe , możemy utworzyć 2 skorelowane zmienne losowe o wzorze
i następnie będzie miał korelacji z .ρ X 1
Czy ktoś może wyjaśnić, skąd pochodzi ta formuła?
Jeśli mamy 2 normalne, nieskorelowane zmienne losowe , możemy utworzyć 2 skorelowane zmienne losowe o wzorze
i następnie będzie miał korelacji z .ρ X 1
Czy ktoś może wyjaśnić, skąd pochodzi ta formuła?
Odpowiedzi:
Załóżmy, że chcesz znaleźć liniową kombinację i taką, żeX 2
Zauważ, że jeśli pomnożysz zarówno i przez tę samą (niezerową) stałą, korelacja się nie zmieni. Dlatego dodamy warunek zachowania wariancji:β var ( α X 1 + β X 2 ) = var ( X 1 )
Jest to równoważne z
Zakładając, że obie zmienne losowe mają tę samą wariancję (jest to kluczowe założenie!) ( ), otrzymujemy
Istnieje wiele rozwiązań tego równania, więc czas przypomnieć warunek zachowania wariancji:
I to nas prowadzi
UPD . W odniesieniu do drugiego pytania: tak, nazywa się to wybielaniem .
Równanie jest uproszczoną dwuwymiarową postacią rozkładu Choleskiego . To uproszczone równanie jest czasem nazywane algorytmem Kaiser-Dickman (Kaiser i Dickman, 1962).
Zauważ, że i muszą mieć tę samą wariancję, aby ten algorytm działał poprawnie. Ponadto algorytm jest zwykle używany z normalnymi zmiennymi. Jeśli lub nie są normalne, może nie mieć takiej samej formy dystrybucyjnej jak .X 2 X 1 X 2 Y X 2
Bibliografia:
Kaiser, HF i Dickman, K. (1962). Macierze wyników próby i populacji oraz macierze korelacji próbki z dowolnej macierzy korelacji populacji. Psychometrika, 27 (2), 179–182.
Współczynnik korelacji to między dwiema seriami, jeśli są one traktowane jako wektory (gdzie punkt danych jest wymiarem wektora). Powyższa formuła po prostu tworzy rozkład wektora na jego komponenty , (w odniesieniu do ).
jeśli , to .n t h n t h cos θ s i n θ X 1 , X 2 ρ = c o s θ √
Ponieważ jeśli są nieskorelowane, kąt między nimi jest kątem prostym (tzn. Można je uznać za ortogonalne, aczkolwiek nienormalizowane wektory podstawowe).