Jaka jest wariancja iloczynu skorelowanych zmiennych losowych ?
Jaka jest wariancja iloczynu skorelowanych zmiennych losowych ?
Odpowiedzi:
Więcej informacji na ten temat, niż zapewne potrzebujesz, można znaleźć w Goodman (1962): „Wariancja iloczynu zmiennych losowych K” , która wyprowadza wzory zarówno dla niezależnych zmiennych losowych, jak i potencjalnie skorelowanych zmiennych losowych, wraz z pewnymi przybliżeniami. We wcześniejszym artykule ( Goodman, 1960 ) wyprowadzono wzór na iloczyn dokładnie dwóch zmiennych losowych, który jest nieco prostszy (choć nadal dość gnarny), więc może to być lepsze miejsce na rozpoczęcie, jeśli chcesz zrozumieć pochodną .
Jednak dla kompletności wygląda to tak.
Załóż, że:
Następnie: lub równoważnie:
Artykuł z 1960 r. Sugeruje, że jest to ćwiczenie dla czytelnika (które wydaje się motywować artykuł z 1962 r.!).
Notacja jest podobna, z kilkoma rozszerzeniami:
Wreszcie, w końcu:
Zobacz dokumenty, aby uzyskać szczegółowe informacje i nieco łatwiejsze przybliżenia!
Wystarczy dodać do niesamowitej odpowiedzi Matta Krause'a (w rzeczywistości łatwo stąd ją uzyskać). Jeśli x, y są niezależne, to
Oprócz ogólnej formuły podanej przez Matta warto zauważyć, że istnieje nieco bardziej wyraźna formuła dla losowych zmiennych Gaussa o średniej zerowej. Wynika to z twierdzenia Isserlisa , patrz także Wyższe momenty dla wyśrodkowanego wielowymiarowego rozkładu normalnego.
Załóżmy, że ma wielowymiarowy rozkład normalny ze średnią 0 i macierzą kowariancji . Jeśli liczba zmiennych jest nieparzysta,
i
gdzie oznacza sumę na wszystkich partycjach w rozłącznych par gdzie każdy termin jest produktem odpowiednich i gdzie
Σ k E ( ∏ i x i ) = 0 V ( ∏ i x i ) = E ( ∏ i x 2 i ) = ∑ ∏ ˜ Σ i , j Σ ∏ { 1 , … , 2 k } k { i , j } k
W rzeczywistości możliwe jest wdrożenie ogólnej formuły. Najtrudniejszą częścią wydaje się być obliczenie wymaganych partycji. W R można to zrobić za pomocą funkcji setparts
z pakietu partitions
. Za pomocą tego pakietu nie było problemu z wygenerowaniem 2 027 025 partycji dla , 34 459 425 partycji dla można również wygenerować, ale nie 654 729 075 partycji dla (na moim laptopie 16 GB).k = 9 k = 10
Warto zwrócić uwagę na kilka innych rzeczy. Po pierwsze, dla zmiennych Gaussa o niezerowej wartości powinno być możliwe wyprowadzenie wyrażenia również z twierdzenia Isserlisa. Po drugie, nie jest dla mnie jasne, czy powyższy wzór jest odporny na odchylenia od normalności, to znaczy, czy można go zastosować jako przybliżenie, nawet jeśli zmienne nie są wielowymiarowe normalnie rozłożone. Po trzecie, chociaż powyższe formuły są prawidłowe, wątpliwe jest, jak wiele wariancji mówi o dystrybucji produktów. Nawet dla rozkład produktu jest dość leptokurtyczny, a dla większego szybko staje się wyjątkowo leptokurtyczny.k