Nie mówisz, co to jest inna książka statystyczna, ale zgaduję, że jest to książka (lub sekcja) o ograniczonym próbkowaniu populacji .
Kiedy próbujesz zmiennych losowych, tj. Kiedy rozważasz zbiór
z n zmiennych losowych, wiesz, że jeśli są one niezależne, f ( x 1 , … , x n ) = f ( x 1 ) ⋯ f ( x n ) i identycznie rozmieszczone , w szczególności E ( X i ) = μ i Var ( X i )X1, … , Xnnfa( x1, … , Xn) =f( x1) ⋯f(xn)mi( Xja) = μ dla wszystkich i , a następnie:
¯ X = ∑ i X iVar(Xi)=σ2i
gdzieσ2jest drugim centralnym momentem.
X¯¯¯¯=∑iXin,E(X¯¯¯¯)=μ,Var(X¯¯¯¯)=σ2n
σ2
Próbkowanie skończonej populacji jest nieco inne. Jeśli populacja ma rozmiar , w pobieraniu próbek bez zastępowania występują ( NN możliwe próbkisio wielkościni są one równoważne:
p(si)=1(Nn)sin
Na przykład, jeśliN=5in=3, przestrzeń próbki wynosi{s1,…,s10},
a możliwe próbki to:
s 1 ={1,2,3}, s 2 ={1,2,4}, s 3 ={1,2,5}, s 4
p(si)=1(Nn)∀i=1,…,(Nn)
N=5n=3{s1,…,s10}
Jeśli policzysz liczbę wystąpień każdej osoby, możesz zobaczyć, że jest ich sześć, tzn. Każda osoba ma równe szanse bycia wybranym (6/10). Tak więc każde
sijest losową próbką zgodnie z drugą definicją. Mniej więcej, nie jest to iid próba losowa, ponieważ ludzie są zmienne nie losowe: można konsekwentnie oszacować
E[X]przez próbkę średnią, ale nigdy nie będą znali jego dokładną wartość, ale
możeznać dokładną średnią zaludnienia jeśli
n=N(niech powtarzam: z grubsza.)
s1={1,2,3},s2={1,2,4},s3={1,2,5},s4={1,3,4},s5={1,3,5},s6={1,4,5},s7={2,3,4},s8={2,3,5},s9={2,4,5},s10={3,4,5}
siE[X]n=N1
Niech będzie średnią z polulacji (średni wzrost, średni dochód, ...). Gdy n < N
, możesz oszacować μ jak w losowym próbkowaniu zmiennych:
¯ y s = n ∑ i = 1 y i ,μn<Nμ
ale średnia wariancja próbki jest inna:
Var ( ¯ y s ) = ˜ σ 2
y¯¯¯s=∑i=1nyi,E(y¯¯¯s)=μ
gdzie
˜ σ 2jest quasi-wariancją populacji:
∑ N i = 1 (yi- ¯ y )2Var(y¯¯¯s)=σ~2n(1−nN)
σ~2 . Współczynnik
(1-n/N)jest zwykle nazywany „
skończonym współczynnikiem korygującym populację”.
∑Ni=1(yi−y¯¯¯)2N−1(1−n/N)
Jest to szybki przykład różnic między próbką losową (zmienną losową) a próbką losową (populacja skończona). Wnioskowanie statystyczne dotyczy głównie losowego próbkowania zmiennych, teoria próbkowania dotyczy próbkowania w populacji skończonej.
1i zinterpretować zestaw żarówek jako próbkę (zmienna losowa). Powiedz teraz, że znajdziesz pudełko 1000 żarówek i chcesz poznać ich średnią długość życia. Możesz wybrać mały zestaw żarówek (skończona próbka populacji), ale możesz wybrać wszystkie z nich. Jeśli wybierzesz małą próbkę, nie przekształcisz żarówek w zmienne losowe: zmienna losowa jest generowana przez Ciebie, ponieważ wybór pomiędzy „wszystkim” a „małym zestawem” zależy od ciebie. Jednakże, gdy populacja skończona jest bardzo duża (powiedzmy populacja kraju), przy wyborze „wszystko” nie jest opłacalne, drugą sytuacją lepiej poradzić sobie jako pierwszą.