Jak stworzyć dowolną macierz kowariancji

21

Na przykład, w RThe MASS::mvrnorm()Funkcja ta jest przydatna do generowania danych, aby wykazać różne rzeczy w statystykach. Bierze obowiązkowy Sigmaargument, który jest macierzą symetryczną określającą macierz kowariancji zmiennych. Jak utworzyć symetryczną macierz z dowolnymi wpisami? $n\times n$

r random-generation covariance-matrix

— rsl
źródło

3

Myślę, że to pytanie przydałoby się zredagowania, aby skupić się na „jak stworzyć dowolną macierz kowariancji”, a mniej na aspekcie kodowania. Na pewno istnieje tutaj tematyczny problem statystyczny, na co wskazuje odpowiedź.

— Silverfish

2

Powiązane: Jak efektywnie generować losowe macierze korelacji dodatnich i półpłynnych?

— ameba mówi Przywróć Monikę

22

Utwórz macierz o dowolnych wartościach $n\times n$ $A$

a następnie użyj jako macierzy kowariancji. $\Sigma = A^T A$

Na przykład

n <- 4  
A <- matrix(runif(n^2)*2-1, ncol=n) 
Sigma <- t(A) %*% A

— Henz
źródło

Podobnie Sigma <- A + t(A).

— rsl

6

@MoazzemHossen: Twoja sugestia wytworzy macierz symetryczną, ale nie zawsze może być dodatnia półfinał (np. Twoja sugestia może wytworzyć matrycę z ujemnymi wartościami własnymi) i dlatego może nie być odpowiednia jako macierz kowariancji

— Henry

Tak, zauważyłem, że R zwraca błąd w przypadku, gdy mój sugerowany sposób wytworzył nieodpowiednią matrycę.

— rsl

4

Zauważ, że jeśli wolisz macierz korelacji dla lepszej interpretacji, istnieje funkcja ? Cov2cor , którą można zastosować później.

— gung - Przywróć Monikę

1

@ B11b: Potrzebujesz macierzy kowariancji, aby była dodatnia na półokreślona. To ograniczyłoby pewne wartości kowariancji, nie do końca oczywiste, gdy

n > 2

$n \gt 2$

— Henry

24

Lubię mieć kontrolę nad obiektami, które tworzę, nawet jeśli mogą one być dowolne.

Rozważmy zatem, że wszystkie możliwe macierze kowariancji można wyrazić w postaci $n\times n$ $\Sigma$

Σ = P^{'} Diagonal (σ_{1}, σ_{2}, \dots, σ_{n}) P

$\Sigma= P^\prime\ \text{Diagonal}(\sigma_1,\sigma_2,\ldots, \sigma_n)\ P$

gdzie jest macierzą ortogonalną, a . $P$ $\sigma_1 \ge \sigma_2 \ge \cdots \ge \sigma_n \ge 0$

Geometrycznie opisuje to strukturę kowariancji z zakresem głównych składników wielkości . Składniki te wskazują w kierunkach rzędami . Zobacz liczby w Analiza sensu analizy głównych składowych, wektorów własnych i wartości własnych dla przykładów z . Ustawienie ustawi wielkości tych kowariancji i ich względnych rozmiarów, a tym samym ustalenia dowolny kształt elipsoidalny. Rzędy orientują osie kształtu według własnego uznania. $\sigma_i$ $P$ $n=3$ $\sigma_i$ $P$

Jedną z korzyści algebraicznych i obliczeniowych tego podejścia jest to, że gdy , jest łatwo odwracane (co jest powszechną operacją na macierzach kowariancji): $\sigma_n \gt 0$ $\Sigma$

Σ^{- 1} = P^{'} Diagonal (1 / σ_{1}, 1 / σ_{2}, \dots, 1 / σ_{n}) P .

$\Sigma^{-1} = P^\prime\ \text{Diagonal}(1/\sigma_1, 1/\sigma_2, \ldots, 1/\sigma_n)\ P.$

Nie przejmujesz się kierunkami, a jedynie zakresami rozmiarów ? W porządku: możesz łatwo wygenerować losową macierz ortogonalną. Wystarczy owinąć standardowe wartości normalne w macierz kwadratową, a następnie ortogonalizować. Prawie na pewno zadziała (pod warunkiem, że nie jest ogromny). Dokonuje tego rozkład QR, jak w tym kodzie $\sigma_i$ $n^2$ $n$

n <- 5
p <- qr.Q(qr(matrix(rnorm(n^2), n)))

Działa to, ponieważ wygenerowany w ten sposób -zmienny rozkład wielomianowy jest „eliptyczny”: jest niezmienny we wszystkich rotacjach i odbiciach (poprzez pochodzenie). Zatem wszystkie ortogonalne macierze są generowane równomiernie, jak argumentowano w Jak generować równomiernie rozmieszczone punkty na powierzchni sfery jednostkowej 3-d? . $n$

Szybki sposób na uzyskanie z i , po ich określeniu lub utworzeniu, wykorzystuje i wykorzystuje ponowne użycie tablic w operacjach arytmetycznych, jak w tym przykładzie z : $\Sigma$ $P$ $\sigma_i$ crossprodR $\sigma=(\sigma_1, \ldots, \sigma_5) = (5,4,3,2,1)$

Sigma <- crossprod(p, p*(5:1))

W ramach kontroli rozkład wartości w liczbie pojedynczej powinien zwracać zarówno jak i . Możesz to sprawdzić za pomocą polecenia $\sigma$ $P^\prime$

svd(Sigma)

Odwrotność Sigmaoczywiście uzyskuje się jedynie przez zmianę mnożenia przez na dzielenie: $\sigma$

Tau <- crossprod(p, p/(5:1))

Możesz to sprawdzić, przeglądając zapsmall(Sigma %*% Tau), która powinna być matrycą tożsamości . Uogólnione odwrotny (niezbędne do obliczenia regresji) otrzymuje się przez zastąpienie któregokolwiek o , dokładnie tak, jak powyżej, ale zachowując wszystkie zera między jak są. $n\times n$ $\sigma_i \ne 0$ $1/\sigma_i$ $\sigma_i$

— Whuber
źródło

Pomoże to zademonstrować, jak używać rzędów

do orientowania osi zgodnie z preferencjami.

P

$P$

— gung - Przywróć Monikę

1

Warto wspomnieć, że osobne wartości svd(Sigma)zostaną ponownie uporządkowane - to mnie na chwilę pomyliło.

— FrankD

1

Możesz symulować losowe dodatnie określone macierze z rozkładu Wishart przy użyciu funkcji „rWishart” z szeroko stosowanego pakietu „stats”.

n <- 4
rWishart(1,n,diag(n))

— Carlos Llosa
źródło

1

Specjalnie do tego jest pakiet clusterGeneration(napisany między innymi przez Harry'ego Joe, wielkie nazwisko w tej dziedzinie).

Istnieją dwie główne funkcje:

genPositiveDefMat wygenerować macierz kowariancji, 4 różne metody
rcorrmatrix : generuj macierz korelacji

Szybki przykład:

library(clusterGeneration)
#> Loading required package: MASS
genPositiveDefMat("unifcorrmat",dim=3)
#> $egvalues
#> [1] 15.408962  5.673916  1.228842
#> 
#> $Sigma
#>          [,1]     [,2]     [,3]
#> [1,] 6.714871 1.643449 6.530493
#> [2,] 1.643449 6.568033 2.312455
#> [3,] 6.530493 2.312455 9.028815
genPositiveDefMat("eigen",dim=3)
#> $egvalues
#> [1] 8.409136 4.076442 2.256715
#> 
#> $Sigma
#>            [,1]       [,2]      [,3]
#> [1,]  2.3217300 -0.1467812 0.5220522
#> [2,] -0.1467812  4.1126757 0.5049819
#> [3,]  0.5220522  0.5049819 8.3078880

^{Utworzono 27.10.2019 przez pakiet reprezentx (v0.3.0)}

Na koniec zwróć uwagę, że alternatywnym podejściem jest wykonanie pierwszej próby od zera, a następnie użycie jej Matrix::nearPD()do określenia dodatniej macierzy.

— Matifou
źródło