To nie jest dowód (i +1 do odpowiedzi @ whubera), ale jest to geometryczny sposób na zbudowanie intuicji, dlaczego jest rozsądna odpowiedź.E(X1|T)=T/nE(X1|T)=T/n
Niech i więc . Uwzględniamy wtedy zdarzenie, że dla jakiegoś , więc to jest jak rysowanie wielowymiarowych Gaussianów obsługiwanych na ale patrząc tylko na te, które kończą w afinii spacja . Następnie chcemy poznać średnią współrzędnych punktów, które lądują w tej afinicznej przestrzeni (nie wspominając, że jest to podzbiór miary zero).X=(X1,…,Xn)TX=(X1,…,Xn)T1=(1,…,1)T1=(1,…,1)TT=1TXT=1TX1TX=t1TX=tt∈Rt∈RRnRn{x∈Rn:1Tx=t}{x∈Rn:1Tx=t}x1x1
Znamy
więc mamy sferyczny gaussian ze stałym średnim wektorem, a średni wektor jest na tej samej linii, co normalny wektor hiperpłaszczyzny .X∼N(μ1,I)X∼N(μ1,I)
μ1μ1xT1=0xT1=0
To daje nam sytuację jak na poniższym obrazku:
Kluczowa idea: najpierw wyobraź sobie gęstość w podprzestrzeni afinicznej . Gęstość jest symetryczna wokół ponieważ . Gęstość będzie również symetryczna w jak jest symetryczny w tym samym wierszu, a punkt, wokół której jest symetryczny jest przecięciem linii i . Dzieje się tak dla .Ht:={x:xT1=t}Ht:={x:xT1=t}XXx1=x2x1=x2E(X)∈span 1E(X)∈span 1HtHtHtHtx1+x2=tx1+x2=tx1=x2x1=x2x=(t/2,t/2)x=(t/2,t/2)
Aby wyobrazić sobie , możemy sobie wyobrazić próbkowanie w kółko, a następnie, gdy otrzymamy punkt w , bierzemy tylko współrzędną i zapisujemy to. Z symetrii gęstości na również rozkład współrzędnych będzie symetryczny i będzie miał ten sam punkt środkowy . Średnia rozkładu symetrycznego jest centralnym punktem symetrii, co oznacza, że , i że ponieważ i można wykasować bez wpływu byle co.E(X1|T)E(X1|T)HtHtx1x1HtHtx1x1t/2t/2E(X1|T)=T/2E(X1|T)=T/2E(X1|T)=E(X2|T)E(X1|T)=E(X2|T)X1X1X2X2
W wyższych wymiarach staje się to trudne (lub niemożliwe) do dokładnej wizualizacji, ale ten sam pomysł ma zastosowanie: mamy sferyczny gaussowski ze średnią w zakresie , i patrzymy na afiniczną podprzestrzeń, która jest do niej prostopadła . Punktem równowagi rozkładu w podprzestrzeni będzie nadal przecięcie i o wartości , a gęstość jest nadal symetryczna, więc ten punkt równowagi jest znowu średnią.11span 1span 1{x:xT1=t}{x:xT1=t}x=(t/n,…,t/n)x=(t/n,…,t/n)
Ponownie, to nie jest dowód, ale myślę, że daje to dobre wyobrażenie o tym, dlaczego można oczekiwać tego zachowania.
Poza tym, jak zauważyli niektórzy tacy jak @StubbornAtom, tak naprawdę nie wymaga to, aby był gaussowski. W 2D zaznacz, że jeśli jest wymienny, to (bardziej ogólnie, ), więc musi być symetryczne wzdłuż linii . Mamy też więc wszystko, co powiedziałem o „kluczowym pomyśle” na pierwszym zdjęciu, nadal jest aktualne. Oto przykład, w którym pochodzą z modelu mieszanki Gaussa. Wszystkie linie mają takie samo znaczenie jak poprzednio.XXXXf(x1,x2)=f(x2,x1)f(x1,x2)=f(x2,x1)f(x)=f(xσ)f(x)=f(xσ)ffx1=x2x1=x2E(X)∈span 1E(X)∈span 1XiXi