Możesz to udowodnić, obliczając gęstość warunkową za pomocą brutalnej siły, jak w linku Procrastinator (+1) w komentarzach. Ale istnieje również twierdzenie, które mówi, że wszystkie rozkłady warunkowe wielowymiarowego rozkładu normalnego są normalne. Dlatego pozostaje tylko obliczyć średni wektor i macierz kowariancji. Pamiętam, że wyprowadziliśmy to w klasie szeregów czasowych w college'u, sprytnie definiując trzecią zmienną i używając jej właściwości do uzyskania wyniku prostszego niż rozwiązanie brutalnej siły w łączu (pod warunkiem, że czujesz się komfortowo z algebrą macierzy). Wychodzę z pamięci, ale było to mniej więcej tak:
Niech będzie pierwszą partycją, a drugą. Teraz zdefiniuj gdzie . Teraz możemy pisaćx1x2z=x1+Ax2A=−Σ12Σ−122
cov(z,x2)=cov(x1,x2)+cov(Ax2,x2)=Σ12+Avar(x2)=Σ12−Σ12Σ−122Σ22=0
Dlatego i są nieskorelowane, a ponieważ są wspólnie normalne, są niezależne . Teraz wyraźnie , dlatego wynika z tego, żezx2E(z)=μ1+Aμ2
E(x1|x2)=E(z−Ax2|x2)=E(z|x2)−E(Ax2|x2)=E(z)−Ax2=μ1+A(μ2−x2)=μ1+Σ12Σ−122(x2−μ2)
co dowodzi pierwszej części. W przypadku macierzy kowariancji należy to zauważyć
var(x1|x2)=var(z−Ax2|x2)=var(z|x2)+var(Ax2|x2)−Acov(z,−x2)−cov(z,−x2)A′=var(z|x2)=var(z)
Teraz prawie skończyliśmy:
var(x1|x2)=var(z)=var(x1+Ax2)=var(x1)+Avar(x2)A′+Acov(x1,x2)+cov(x2,x1)A′=Σ11+Σ12Σ−122Σ22Σ−122Σ21−2Σ12Σ−122Σ21=Σ11+Σ12Σ−122Σ21−2Σ12Σ−122Σ21=Σ11−Σ12Σ−122Σ21
co dowodzi drugiej części.
Uwaga: Dla osób niezbyt dobrze zaznajomionych z używaną tutaj algebrą macierzy jest to doskonały zasób .
Edycja: użyta tutaj jedna właściwość, której nie ma w macierzowej książce kucharskiej (dobry chwyt @FlyingPig) to właściwość 6 na stronie wikipedii o macierzach kowariancji: to znaczy, że dla dwóch losowych wektorów , Oczywiście w przypadku skalarów ale dla wektorów są one różne, o ile matryce są ułożone inaczej.x,y
var(x+y)=var(x)+var(y)+cov(x,y)+cov(y,x)
cov(X,Y)=cov(Y,X)