Intuicja kryjąca się za wzorem wariancji sumy dwóch zmiennych


10

Wiem z poprzednich badań, że

Var(A+B)=Var(A)+Var(B)+2Cov(A,B)

Nie rozumiem jednak, dlaczego tak jest. Widzę, że efektem będzie „podniesienie” wariancji, gdy kowboja A i B bardzo wysoko. Sensowne jest, że gdy tworzysz kompozyt z dwóch wysoce skorelowanych zmiennych, zwykle dodajesz wysokie obserwacje z A z wysokimi obserwacjami z B, a niskie obserwacje z A z niskimi obserwacjami z B. To będzie miało tendencję do tworzyć ekstremalnie wysokie i niskie wartości w zmiennej złożonej, zwiększając wariancję złożonej.

Ale dlaczego zwielokrotnia kowariancję przez dokładnie 2?


1
Jeśli i B są doskonale dodatnio skorelowane, wówczas V a r ( A + B ) = V a r ( A ) + V a r ( B ) + 2 AB a jeśli są całkowicie ujemnie skorelowane, wówczasVar(A+B)=Var(A)+Var(B)-2Var(A+B)=Var(A)+Var(B)+2Var(A)Var(B) . Kowariancja mierzy, jak daleko w tym zakresie jest ich związekVar(A+B)=Var(A)+Var(B)2Var(A)Var(B)
Henry

Odpowiedzi:


21

Prosta odpowiedź:

Wariancja obejmuje kwadrat:

Var(X)=E[(XE[X])2]

Zatem twoje pytanie sprowadza się do czynnika 2 w kwadratowej tożsamości:

(a+b)2=a2+b2+2ab

Które można rozumieć wizualnie jako rozkład pola kwadratu boku na obszar mniejszych kwadratów boków a i b , oprócz dwóch prostokątów boków a i b :(a+b)abab

wprowadź opis zdjęcia tutaj

Bardziej zaangażowana odpowiedź:

Jeśli chcesz matematycznie bardziej zaangażowanej odpowiedzi, kowariancja jest formą dwuliniową, co oznacza, że ​​jest liniowa zarówno w pierwszym, jak i drugim argumencie, prowadzi to do:

Var(A+B)=Cov(A+B,A+B)=Cov(A,A+B)+Cov(B,A+B)=Cov(A,A)+Cov(A,B)+Cov(B,A)+Cov(B,B)=Var(A)+2Cov(A,B)+Var(B)

W ostatnim wierszu wykorzystałem fakt, że kowariancja jest symetryczna:

Cov(A,B)=Cov(B,A)

Podsumowując:

To dwa, ponieważ musisz uwzględnić zarówno i c o v ( B , A ) .cov(A,B)cov(B,A)


5

Zbiór zmiennych losowych jest przestrzenią wektorową, a wiele właściwości przestrzeni euklidesowej można do nich analogować. Odchylenie standardowe działa podobnie do długości, a wariancja do kwadratu. Niezależność odpowiada byciu ortogonalnym, a idealna korelacja odpowiada zwielokrotnieniu skalarnemu. Zatem wariancja zmiennych niezależnych jest zgodna z twierdzeniem Pitagorasa:
.var(A+B)=var(A)+var(B)

Jeśli są idealnie skorelowane, to
std(A+B)=std(A)+std(B)

Zauważ, że jest to równoważne z
var(A+B)=var(A)+var(B)+2var(A)var(B)


var(A+B)=var(A)+var(B)+2cov(A,B)

ABcov(A,B)var(A,B)var(A)var(B)2var(A)var(B) term; the more correlated the variables are, the larger this third term will be. And this is precisely what 2cov(A,B) is: it's 2var(A)var(B) times the r2 of A and B.

var(A+B)=var(A)+var(B)+MeasureOfCorrelationPerfectCorrelationTerm

where MeasureOfCorrelation=r2 and PerfectCorrelationTerm=2var(A)var(B)

Put in other terms, if r=correl(A,B), then

σA+B=σA2+σB2+2(rσA)(rσB)

Thus, r2 is analogous to the cos in the Law of Cosines.


2

I would add that what you cited is not the definition of Var(A+B), but rather a consequence of the definitions of Var and Cov. So the answer to why that equation holds is the calculation carried out by byouness. Your question may really be why that makes sense; informally:

How much A+B will "vary" depends on four factors:

  1. How much A would vary on its own.
  2. How much B would vary on its own.
  3. How much A will vary as B moves around (or varies).
  4. How much B will vary as A moves around.

Which brings us to

Var(A+B)=Var(A)+Var(B)+Cov(A,B)+Cov(B,A)
=Var(A)+Var(B)+2Cov(A,B)
because Cov is a symmetric operator.
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.