Niech będą odrębnymi obserwacjami (bez powiązań). Niech oznacza próbkę bootstrap (próbka z empirycznego CDF) i niech . Znajdź i .X1,...,XnX∗1,...,X∗nX¯∗n=1n∑ni=1X∗iE(X¯∗n)Var(X¯∗n)
Do tej pory mam to, że to każdy z prawdopodobieństwem więc
i
co daje
X∗iX1,...,Xn1n
E(X∗i)=1nE(X1)+...+1nE(Xn)=nμn=μ
E(X∗2i)=1nE(X21)+...+1nE(X2n)=n(μ2+σ2)n=μ2+σ2,
Var(X∗i)=E(X∗2i)−(E(X∗i))2=μ2+σ2−μ2=σ2.
Następnie
and
od ' są niezależne. To daje
E(X¯∗n)=E(1n∑i=1nX∗i)=1n∑i=1nE(X∗i)=nμn=μ
Var(X¯∗n)=Var(1n∑i=1nX∗i)=1n2∑i=1nVar(X∗i)
X∗iVar(X¯∗n)=nσ2n2=σ2n
Jednak nie otrzymuję tej samej odpowiedzi, gdy na i używam formuły dla wariacyjnej wariancji:
X1,…,Xn
Var(X¯∗n)=E(Var(X¯∗n|X1,...,Xn))+Var(E(X¯∗n|X1,…,Xn)).
E(X¯∗n|X1,…,Xn)=X¯n i Var(X¯∗n|X1,…,Xn)=1n2(∑X2i−nX¯2n) więc podłączenie ich do powyższej formuły daje (po pewnej algebrze) Var(X¯∗n)=(2n−1)σ2n2 .
Czy robię tu coś złego? Mam wrażenie, że nie używam poprawnie formuły wariancji warunkowej, ale nie jestem pewien. Każda pomoc będzie mile widziana.