Przykład dwóch * skorelowanych * zmiennych normalnych, których suma nie jest normalna

Znam kilka fajnych przykładów par skorelowanych zmiennych losowych, które są marginalnie normalne, ale nie są razem normalne. Zobacz tę odpowiedź za Dilip Sarwate , a ten jeden przez kard .

Znam też przykład dwóch normalnych zmiennych losowych, których suma nie jest normalna. Zobacz tę odpowiedź w Makrze . Ale w tym przykładzie dwie zmienne losowe są nieskorelowane.

Czy istnieje przykład dwóch normalnych zmiennych losowych, które mają niezerową kowariancję i których suma nie jest normalna? Czy też można udowodnić, że suma dowolnych dwóch skorelowanych normalnych zmiennych losowych, nawet jeśli nie są one dwuwymiarowe normalne, musi być normalna?

[Kontekst: mam pytanie domowe, które prosi o dystrybucji , gdzie i są standardowe normalne z korelacji . Myślę, że pytanie miało na celu sprecyzowanie, że są one dwuwymiarowe normalne. Ale zastanawiam się, czy można coś powiedzieć bez tego dodatkowego założenia dla niezerowego.] $aX+bY$ $X$ $Y$ $\rho$ $\rho$

Dzięki!

— mww
źródło

Odpowiedź kardynała, którą cytujesz, zawiera już rozwiązanie: patrz prawy górny róg w jego panelu przykładów.

— whuber

Czy możesz wyjaśnić, w jaki sposób? Określa wspólny rozkład, który daje dwa normalne marginesy. Nie jest dla mnie jasne, że suma dwóch normalnych marginesów nie jest normalna, o co mi chodzi. (Zobacz także mój komentarz do odpowiedzi Glen_b poniżej.)

— mww

Z samego obrazu widać, że gęstość sumy przy zera wynosi zero (ponieważ linia

przecina wykres w jednym punkcie, który ma miarę zerową), podczas gdy sama suma jest równie oczywiście symetryczna względem zero, wskazując, że zero jest środkiem rozkładu sumy. Taki rozkład nie może być normalny, ponieważ rozkłady normalne mają niezerowe gęstości w swoich centrach.

x + y = 0

$x+y=0$

— whuber

Odpowiedzi:

Prawie każda dwuwymiarowa kopuła wytworzy parę normalnych losowych zmiennych z pewną niezerową korelacją (niektóre dadzą zero, ale są to przypadki szczególne). Większość (prawie wszystkie) z nich wygeneruje niestandardową sumę.

W niektórych rodzinach kopul można uzyskać dowolną pożądaną (populacyjną) korelację Spearmana ; trudność polega jedynie na znalezieniu korelacji Pearsona dla normalnych marginesów; jest to w zasadzie wykonalne, ale algebra może być dość skomplikowana. [Jeśli jednak masz populacyjną korelację Spearmana, korelacja Pearsona - przynajmniej w przypadku lekkich marginesów ogonowych, takich jak gaussowski - w wielu przypadkach może nie być zbyt daleko.]

Wszystkie oprócz dwóch pierwszych przykładów na wykresie kardynała powinny dawać sumy nienormalne.

Kilka przykładów - pierwsze dwa pochodzą z tej samej rodziny kopul, co piąty przykład dwuwymiarowych rozkładów kardynałów, trzeci jest zdegenerowany.

Przykład 1:

$\theta=-0.7$

histogramy marginesów normalnych, nienormalna suma i wykres rozkładu dwuwymiarowego

Tutaj suma jest bardzo wyraźnie pikowana i dość silnie pochylona

$\$

Przykład 2:

$\theta=2$

histogramy marginesów normalnych, nienormalna suma i wykres rozkładu dwuwymiarowego

$-(x+y)$

$\hspace{1cm}$ nałożony histogram x + y i - (x + y)

$\$

$X^*=-X$ $Y^*=-Y$

Z drugiej strony, jeśli po prostu zanegujemy jeden z nich, zmienilibyśmy związek między siłą wypaczenia ze znakiem korelacji (ale nie jego kierunkiem).

Warto również pobawić się kilkoma różnymi kopulami, aby zorientować się, co może się stać z rozkładem dwuwymiarowym i normalnymi marginesami.

Marginesy gaussowskie z kopułą t można eksperymentować, nie martwiąc się zbytnio o szczegóły kopuł (generuj z skorelowanej dwuwymiarowej t, co jest łatwe, a następnie przekształcaj w jednolite marginesy za pomocą transformacji całkowej prawdopodobieństwa, a następnie przekształcaj jednolite marginesy w gaussowską za pomocą odwrotny normalny cdf). Będzie miała nietypową, ale symetryczną sumę. Więc nawet jeśli nie masz ładnych pakietów copula, nadal możesz robić pewne rzeczy dość łatwo (np. Gdybym próbował szybko pokazać przykład w Excelu, prawdopodobnie zacznę od t-copula).

Przykład 3 : (bardziej przypomina to, od czego powinienem zacząć)

$U$ $V=U$ $0\leq U<\frac{1}{2}$ $V=\frac{3}{2}-U$ $\frac{1}{2}\leq U\leq 1$ $U$ $V$ $X=\Phi^{-1}(U), Y=\Phi^{-1}(V)\,$ $X+Y$

wprowadź opis zdjęcia tutaj

W tym przypadku korelacja między nimi wynosi około 0,66.

$X$ $Y$

$U$ $(\frac{1}{2}-c,\frac{1}{2}+c)$ $c$ $[0,\frac{1}{2}]$ $V$

Jakiś kod:

library("copula")
par(mfrow=c(2,2))

# Example 1
U <- rCopula(100000, claytonCopula(-.7))
x <- qnorm(U[,1])
y <- qnorm(U[,2])
cor(x,y)
hist(x,n=100)
hist(y,n=100)
xysum <- rowSums(qnorm(U))
hist(xysum,n=100,main="Histogram of x+y")
plot(x,y,cex=.6,
       col=rgb(0,100,0,70,maxColorValue=255),
       main="Bivariate distribution")
text(-3,-1.2,"cor = -0.68")
text(-2.5,-2.8,expression(paste("Clayton: ",theta," = -0.7")))

Drugi przykład:

#--
# Example 2:
U <- rCopula(100000, claytonCopula(2))
x <- qnorm(U[,1])
y <- qnorm(U[,2])
cor(x,y)
hist(x,n=100)
hist(y,n=100)
xysum <- rowSums(qnorm(U))
hist(xysum,n=100,main="Histogram of x+y")
plot(x,y,cex=.6,
    col=rgb(0,100,0,70,maxColorValue=255),
    main="Bivariate distribution")
text(3,-2.5,"cor = 0.68")
text(2.5,-3.6,expression(paste("Clayton: ",theta," = 2")))
#
par(mfrow=c(1,1))

Kod dla trzeciego przykładu:

#--
# Example 3:
u <- runif(10000)
v <- ifelse(u<.5,u,1.5-u)
x <- qnorm(u)
y <- qnorm(v)
hist(x+y,n=100)

— Glen_b - Przywróć Monikę
źródło

X + Y = 2 I Z + (1 - I) U + (1 - I) V

$X+Y=2IZ+(1-I)U+(1-I)V$

I = 0

$I=0$

U + V

$U+V$

I = 1

$I=1$

2 Z

$2Z$ dystrybucja nie jest normalna.

— mww

ρ

$\rho$

Zastąpiłem ten przykład dwoma konkretnymi przykładami wykorzystującymi kopuły Claytona

— Glen_b -Reinstate Monica

Fantastycznie - dzięki! Specjalne podziękowania za kod R.

— mww

Dodałem trzeci przykład, a na koniec nakreślam sposób, aby uzyskać coś takiego, co pierwotnie próbowałem - sposób na uzyskanie dostrojonej korelacji między -1 a 1 (oprócz specjalnych przypadków na końcach), ale dla których suma jest nienormalna.

— Glen_b

-1

Wymyśliłem jeden przykład. X jest standardową zmienną normalną, a Y = -X. Następnie X + Y = 0, co jest stałe. Czy ktoś może potwierdzić, że to kontrprzykład?

Wiemy, że jeśli X, Y są wspólnie normalne, to ich suma jest również normalna. Ale co jeśli ich korelacja wynosi -1 ??

Jestem trochę zdezorientowany. Dzięki.

— Zirui Zhang
źródło

Otrzymujesz to samo, gdy X = Y, a następnie XY = 0. Są to rozkłady normalne, które nie są dwuwymiarowe normalne. Stąd właściwość, że kombinacje liniowe są normalne, która dotyczy dwuwymiarowej normalnej, nie musi mieć zastosowania.

— Michael R. Chernick

σ \to 0

$\sigma\to 0$