To pytanie również graniczy z teorią statystyki - testowanie normalności przy ograniczonych danych może być wątpliwe (chociaż wszyscy robiliśmy to od czasu do czasu).
Alternatywnie możesz spojrzeć na współczynniki kurtozy i skośności. Z Hahna i Shapiro: Modele statystyczne w inżynierii. Podano pewne tło na temat właściwości Beta1 i Beta2 (strony 42 do 49) oraz Ryc. 6-1 na stronie 197. Dodatkową teorię można znaleźć na Wikipedii (patrz Dystrybucja Pearson).
Zasadniczo musisz obliczyć tak zwane właściwości Beta1 i Beta2. Beta1 = 0 i Beta2 = 3 sugerują, że zestaw danych zbliża się do normalności. To trudny test, ale przy ograniczonych danych można argumentować, że każdy test można uznać za trudny.
Beta1 jest związana odpowiednio z momentami 2 i 3 lub wariancją i skośnością . W programie Excel są to VAR i SKEW. Gdzie ... jest twoja tablica danych, formuła jest następująca:
Beta1 = SKEW(...)^2/VAR(...)^3
Beta2 związana jest odpowiednio z momentami 2 i 4 lub wariancją i kurtozą . W programie Excel są to VAR i KURT. Gdzie ... jest twoja tablica danych, formuła jest następująca:
Beta2 = KURT(...)/VAR(...)^2
Następnie możesz je porównać z wartościami odpowiednio 0 i 3. Ma to tę zaletę, że potencjalnie identyfikuje inne rozkłady (w tym rozkłady Pearsona I, I (U), I (J), II, II (U), III, IV, V, VI, VII). Na przykład wiele powszechnie używanych rozkładów, takich jak Uniform, Normal, t-Studenta, Beta, Gamma, wykładniczy i Log-Normal można wskazać na podstawie tych właściwości:
Where: 0 <= Beta1 <= 4
1 <= Beta2 <= 10
Uniform: [0,1.8] [point]
Exponential: [4,9] [point]
Normal: [0,3] [point]
Students-t: (0,3) to [0,10] [line]
Lognormal: (0,3) to [3.6,10] [line]
Gamma: (0,3) to (4,9) [line]
Beta: (0,3) to (4,9), (0,1.8) to (4,9) [area]
Beta J: (0,1.8) to (4,9), (0,1.8) to [4,6*] [area]
Beta U: (0,1.8) to (4,6), [0,1] to [4.5) [area]
Impossible: (0,1) to (4.5), (0,1) to (4,1] [area]
Undefined: (0,3) to (3.6,10), (0,10) to (3.6,10) [area]
Values of Beta1, Beta2 where brackets mean:
[ ] : includes (closed)
( ) : approaches but does not include (open)
* : approximate
Są one zilustrowane na rycinie 6-1 Hahna i Shapiro.
To prawda, że jest to bardzo trudny test (z pewnymi problemami), ale możesz rozważyć jego wstępną kontrolę przed przejściem na bardziej rygorystyczną metodę.
Istnieją również mechanizmy dostosowawcze do obliczania Beta1 i Beta2, w których dane są ograniczone - ale to wykracza poza ten post.