Tradycyjnie wnioskowanie statystyczne jest nauczane w kontekście próbek prawdopodobieństwa i charakteru błędu próbkowania. Ten model jest podstawą testu istotności. Istnieją jednak inne sposoby modelowania systematycznych odstępstw od przypadku i okazuje się, że nasze testy parametryczne (oparte na próbkowaniu) są zwykle dobrym przybliżeniem tych alternatyw.
Testy parametryczne hipotez opierają się na teorii próbkowania w celu oszacowania prawdopodobnego błędu. Jeśli próbka o danym rozmiarze zostanie pobrana z populacji, znajomość systematycznego charakteru próbkowania sprawia, że badania i przedziały ufności mają znaczenie. W przypadku populacji teoria pobierania próbek jest po prostu nieistotna, a testy nie mają znaczenia w tradycyjnym znaczeniu. Wnioskowanie jest bezużyteczne, nie ma co do tego wnioskować, jest tylko rzecz… sam parametr.
Niektórzy omijają to, odwołując się do super-populacji, które reprezentuje obecny spis. Uważam te apele za nieprzekonujące - testy parametryczne opierają się na próbkowaniu prawdopodobieństwa i jego cechach. Populacja w danym czasie może być próbką większej populacji w czasie i miejscu. Nie widzę jednak żadnego sposobu, aby można było słusznie argumentować, że jest to próbka losowa (lub bardziej ogólnie dowolna forma prawdopodobieństwa). Bez próbki prawdopodobieństwa teoria próbkowania i tradycyjna logika testowania po prostu nie mają zastosowania. Równie dobrze możesz przetestować na podstawie próbki wygody.
Oczywiście, aby zaakceptować testowanie przy użyciu populacji, musimy zrezygnować z podstawy tych testów w procedurach pobierania próbek. Jednym ze sposobów na to jest rozpoznanie ścisłego związku między naszymi testami teoretycznymi na próbce - takimi jak t, Z i F - a procedurami randomizacji. Testy randomizacyjne opierają się na dostępnej próbce. Jeśli zbieram dane o dochodach mężczyzn i kobiet, modelem prawdopodobieństwa i podstawą naszych oszacowań błędu są powtarzane losowe alokacje rzeczywistych wartości danych. Mógłbym porównać zaobserwowane różnice między grupami z rozkładem opartym na tej randomizacji. (Nawiasem mówiąc, robimy to cały czas w eksperymentach, w których losowe pobieranie próbek z modelu populacji rzadko jest odpowiednie).
Okazuje się, że testy teoretyczne są często dobrym przybliżeniem testów randomizacyjnych. Tak więc ostatecznie uważam, że testy z populacji są przydatne i znaczące w tych ramach i mogą pomóc odróżnić systematyczne od zmienności szans - tak jak w przypadku testów opartych na próbach. Logika zastosowana w tym celu jest nieco inna, ale nie ma to większego wpływu na praktyczne znaczenie i wykorzystanie testów. Oczywiście lepiej byłoby po prostu bezpośrednio zastosować testy randomizacji i permutacji, ponieważ są one łatwo dostępne przy użyciu całej naszej nowoczesnej mocy obliczeniowej.