Intuicja kryjąca się za wzorem wariancji sumy dwóch zmiennych

10

Wiem z poprzednich badań, że

$Var(A+B) = Var(A) + Var(B) + 2 Cov (A,B)$

Nie rozumiem jednak, dlaczego tak jest. Widzę, że efektem będzie „podniesienie” wariancji, gdy kowboja A i B bardzo wysoko. Sensowne jest, że gdy tworzysz kompozyt z dwóch wysoce skorelowanych zmiennych, zwykle dodajesz wysokie obserwacje z A z wysokimi obserwacjami z B, a niskie obserwacje z A z niskimi obserwacjami z B. To będzie miało tendencję do tworzyć ekstremalnie wysokie i niskie wartości w zmiennej złożonej, zwiększając wariancję złożonej.

Ale dlaczego zwielokrotnia kowariancję przez dokładnie 2?

variance covariance intuition

— user1205901 - Przywróć Monikę
źródło

1

Jeśli

i

są doskonale dodatnio skorelowane, wówczas

A

$A$

B

$B$

a jeśli są całkowicie ujemnie skorelowane, wówczas

V a r (A + B) = V a r (A) + V a r (B) + 2 \sqrt{V a r (A) V a r (B)}

$Var(A+B)= Var(A) + Var(B)+ 2\sqrt{ Var(A) Var(B)}$

. Kowariancja mierzy, jak daleko w tym zakresie jest ich związek

V a r (A + B) = V a r (A) + V a r (B) - 2 \sqrt{V a r (A) V a r (B)}

$Var(A+B)= Var(A) + Var(B)- 2\sqrt{ Var(A) Var(B)}$

— Henry

21

Prosta odpowiedź:

Wariancja obejmuje kwadrat:

V a r (X) = E [(X - E [X])^{2}]

$Var(X) = E[(X - E[X])^2]$

Zatem twoje pytanie sprowadza się do czynnika 2 w kwadratowej tożsamości:

(a + b)^{2} = a^{2} + b^{2} + 2 a b

$(a+b)^2 = a^2 + b^2 + 2ab$

Które można rozumieć wizualnie jako rozkład pola kwadratu boku na obszar mniejszych kwadratów boków i , oprócz dwóch prostokątów boków i : $(a+b)$ $a$ $b$ $a$ $b$

Bardziej zaangażowana odpowiedź:

Jeśli chcesz matematycznie bardziej zaangażowanej odpowiedzi, kowariancja jest formą dwuliniową, co oznacza, że jest liniowa zarówno w pierwszym, jak i drugim argumencie, prowadzi to do:

\begin{aligned} V a r (A + B) & = C o v (A + B, A + B) \\ = C o v (A, A + B) + C o v (B, A + B) \\ = C o v (A, A) + C o v (A, B) + C o v (B, A) + C o v (B, B) \\ = V a r (A) + 2 C o v (A, B) + V a r (B) \end{aligned}

$\begin{aligned} Var(A+B) &= Cov(A+B, A+B) \\ &= Cov(A, A+B) + Cov(B, A+B) \\ &= Cov(A,A) + Cov(A,B) + Cov(B,A) + Cov(B,B) \\ &= Var(A) + 2 Cov(A,B) + Var(B) \end{aligned}$

W ostatnim wierszu wykorzystałem fakt, że kowariancja jest symetryczna:

C o v (A, B) = C o v (B, A)

$Cov(A,B) = Cov(B,A)$

Podsumowując:

To dwa, ponieważ musisz uwzględnić zarówno i . $cov(A,B)$ $cov(B,A)$

— cześć
źródło

5

Zbiór zmiennych losowych jest przestrzenią wektorową, a wiele właściwości przestrzeni euklidesowej można do nich analogować. Odchylenie standardowe działa podobnie do długości, a wariancja do kwadratu. Niezależność odpowiada byciu ortogonalnym, a idealna korelacja odpowiada zwielokrotnieniu skalarnemu. Zatem wariancja zmiennych niezależnych jest zgodna z twierdzeniem Pitagorasa:
. $var(A+B) = var(A)+var(B)$

Jeśli są idealnie skorelowane, to
$std(A+B) = std(A)+std(B)$

Zauważ, że jest to równoważne z
$var(A+B) = var(A)+var(B)+2\sqrt{var(A)var(B)}$

$var(A+B) = var(A)+var(B)+2cov(A,B)$

$A$ $B$ $cov(A,B)$ $var(A,B)$ $var(A)$ $var(B)$ $2\sqrt{var(A)var(B)}$ term; the more correlated the variables are, the larger this third term will be. And this is precisely what $2cov(A,B)$ is: it's $2\sqrt{var(A)var(B)}$ times the $r^2$ of $A$ and $B$ .

$var(A+B) = var(A)+var(B)+MeasureOfCorrelation*PerfectCorrelationTerm$

where $MeasureOfCorrelation = r^2$ and $PerfectCorrelationTerm=2\sqrt{var(A)var(B)}$

Put in other terms, if $r = correl(A,B)$ , then

$\sigma_{A+B} = \sigma_A^2+\sigma_B^2+ 2(r\sigma_A)(r\sigma_B)$

Thus, $r^2$ is analogous to the $cos$ in the Law of Cosines.

— Acccumulation
źródło

2

I would add that what you cited is not the definition of $Var(A+B)$ , but rather a consequence of the definitions of $Var$ and $Cov$ . So the answer to why that equation holds is the calculation carried out by byouness. Your question may really be why that makes sense; informally:

How much $A+B$ will "vary" depends on four factors:

How much $A$ would vary on its own.
How much $B$ would vary on its own.
How much $A$ will vary as $B$ moves around (or varies).
How much $B$ will vary as $A$ moves around.

Which brings us to

V a r (A + B) = V a r (A) + V a r (B) + C o v (A, B) + C o v (B, A)

$Var(A+B)=Var(A)+Var(B)+Cov(A,B)+Cov(B,A)$

= V a r (A) + V a r (B) + 2 C o v (A, B)

$=Var(A)+Var(B)+2Cov(A,B)$ because

C o v

$Cov$ is a symmetric operator.

— Bananin
źródło