Chcę obliczyć wartość p, aby odrzucić H0 na poziomie istotności α iff p <α; udowadniając, że moja populacja jest normalnie podzielona.
Rozkład normalny powstaje, gdy dane są generowane przez serię addytywnych zdarzeń ididalnych (patrz obrazek quincunx poniżej). Oznacza to brak sprzężeń zwrotnych i korelacji, czy to brzmi jak proces prowadzący twoje dane? Jeśli nie, prawdopodobnie nie jest to normalne.
Istnieje prawdopodobieństwo, że w twoim przypadku może wystąpić taki proces. Najbliżej „udowadniania” jest zebranie wystarczającej ilości danych, aby wykluczyć wszelkie inne dystrybucje, które ludzie mogą wymyślić (co prawdopodobnie nie jest praktyczne). Innym sposobem jest wydedukowanie rozkładu normalnego z pewnej teorii wraz z innymi przewidywaniami. Jeśli dane są zgodne z wszystkimi z nich i nikt nie może wymyślić innego wyjaśnienia, byłby to dobry dowód na korzyść normalnego rozkładu.
https://en.wikipedia.org/wiki/Bean_machine
Teraz, jeśli nie spodziewasz się żadnej konkretnej dystrybucji a priori, nadal rozsądne może być użycie normalnej dystrybucji do podsumowania danych, ale zauważ, że jest to zasadniczo wybór wynikający z niewiedzy ( https://en.wikipedia.org/wiki/ Principle_of_maximum_entropy ). W takim przypadku nie chcesz wiedzieć, czy populacja jest normalnie podzielona, a raczej chcesz wiedzieć, czy rozkład normalny jest rozsądnym przybliżeniem dla każdego następnego kroku.
W takim przypadku powinieneś podać swoje dane (lub wygenerowane dane, które są podobne) wraz z opisem tego, co zamierzasz z nimi zrobić, a następnie zapytać: „W jaki sposób zakładanie normalności w tym przypadku może mnie wprowadzić w błąd?”