Uogólnijmy, aby skupić się na istocie sprawy. Sprecyzuję najdrobniejsze szczegóły, aby nie pozostawiać wątpliwości. Analiza wymaga tylko następujących czynności:
Średnią arytmetyczną z zestawu liczb określa sięz1, … , Zm
1m( z1+ ⋯ + zm) .
Oczekiwanie jest operatorem liniowym. Oznacza to, że gdy są zmiennymi losowymi, a są liczbami, to oczekiwanie kombinacji liniowej jest kombinacją liniową oczekiwań,α iZja, i = 1 , … , mαja
E ( α1Z1+ ⋯ + αmZm) = α1E ( Z1) + ⋯ + αmE ( Zm) .
Niech będzie próbką uzyskaną z zestawu danych poprzez pobranie elementów równomiernie z zamianą. Niech jest średnią arytmetyczną z . To jest zmienna losowa. Następnie( B 1 , … , B k ) x = ( x 1 , … , x n ) k x m ( B ) Bb( B1, … , Bk)x = ( x1, ... ,xn)kxm ( B )b
E ( m ( B ) ) = E ( 1k( B1+ ⋯ + Bk) ) = 1k( E ( B1) + ⋯ + E ( Bk) )
następuje liniowość oczekiwań. Ponieważ wszystkie elementy są otrzymywane w ten sam sposób, wszystkie mają takie same oczekiwania, powiedzmy:bbb
E ( B1) = ⋯ = E ( Bk) = b .
Upraszcza to powyższe
E ( m ( B ) ) = 1k( b + b + ⋯ + b ) = 1k( k b ) = b .
Z definicji oczekiwanie jest sumą wartości ważoną prawdopodobieństwem. Ponieważ zakłada się, że każda wartość ma jednakową szansę na wybranie ,1 / nX1 / n
E (m(B))=b= E ( B1) = 1nx1+ ⋯ + 1nxn= 1n( x1+ ⋯ + xn) = x¯,
średnia arytmetyczna danych.
Aby odpowiedzieć na pytanie, jeśli używa się średniej danych do oszacowania średniej populacji, to średnia ładowania początkowego (tak jest w przypadku ) również równa się , a zatem jest identyczna jak estymator średniej populacji . k=n ˉ xx¯k = nx¯
W przypadku statystyk, które nie są liniowymi funkcjami danych, ten sam wynik niekoniecznie się utrzymuje. Jednak błędem byłoby po prostu zastąpienie średniej wartości ładowania początkowego wartością statystyki w danych: nie tak działa ładowanie początkowe. Zamiast tego, porównując średnią ładowania początkowego ze statystyką danych , uzyskujemy informacje na temat błędu statystycznego statystyki. Można to wykorzystać do dostosowania oryginalnej statystyki w celu usunięcia błędu. W związku z tym oszacowanie skorygowane o błąd systematyczny staje się w ten sposób algebraiczną kombinacją oryginalnej statystyki i średniej początkowej. Aby uzyskać więcej informacji, wyszukaj „BCa” (bootstrap z korekcją błędów i przyspieszeniem) i „ABC”. Wikipedia zawiera pewne odniesienia.