n ( N - 1 ) / N = 1 - ( 1 / N ) 1 - 2 / N 1 - 17 / N exp ( - 1 / N )N jest wielkością populacji, a jest wielkością próby. Pytanie dotyczy tego, dlaczego wariancja populacji jest średnim kwadratowym odchyleniem od średniej, a nie razy. Jeśli o to chodzi, po co się tu zatrzymywać? Dlaczego na przykład nie pomnożyć średniego odchylenia do kwadratu przez lub lub ?n(N−1)/N=1−(1/N)1−2/N1−17/Nexp(−1/N)
Jest naprawdę dobry powód, aby tego nie robić. Każda z tych liczb, o których właśnie wspomniałem, posłuży jako dobry sposób na oszacowanie „typowego rozprzestrzeniania się” w populacji. Jednak bez wcześniejszej wiedzy na temat wielkości populacji niemożliwe byłoby użycie próby losowej w celu znalezienia obiektywnego oszacowania takiej liczby. Wiemy, że wariancja próby , która zwielokrotnia średnie kwadratowe odchylenie od średniej próby przez , jest obiektywnym estymatorem zwykłej wariancji populacji przy próbkowaniu z wymianą. (Nie ma problemu z dokonaniem tej korekty, ponieważ znamy !) W związku z tym wariancja próbki byłaby tendencyjnym estymatorem dowolnej wielokrotności wariancji populacji, w której ta wielokrotność, np.n 1 - 1 / N(n−1)/nn1−1/N, nie jest wcześniej dokładnie znany.
Ten problem z nieznaną ilością stronniczości rozprzestrzeniłby się na wszystkie testy statystyczne wykorzystujące wariancję próbki, w tym testy t i testy F. W efekcie dzielenie przez formułę wariancji populacyjnej innej niż wymagałoby zmiany wszystkich tabel statystycznych statystyki t i statystyki F (oraz wielu innych tabel), ale dostosowanie zależałoby od wielkości populacji. Nikt nie chce tworzyć tabel dla każdego możliwego ! Zwłaszcza, gdy nie jest to konieczne.NNN
Z praktycznego punktu widzenia, gdy jest na tyle, że przy użyciu małych zamiast w formułach robi różnicę, zwykle nie zna wielkości populacji (lub można odgadnąć go dokładnie) i będzie prawdopodobnie uciekać się do znacznie bardziej istotnego małej populacji poprawki podczas pracy z losowymi próbkami (bez zastępowania) z populacji. We wszystkich innych przypadkach, kogo to obchodzi? Różnica nie ma znaczenia. Z tych powodów, kierując się względami pedagogicznymi (a mianowicie skupieniem się na szczegółach, które mają znaczenie i połyskiem nad szczegółami, które nie mają znaczenia), niektóre doskonałe teksty ze statystyk wprowadzających nawet nie przeszkadzają w nauczaniu różnicy: po prostu zapewniają formułę pojedynczej wariancji ( dzielić przezN - 1 N N nNN−1NN lub zależnie od przypadku).n