Oryginalny post pomija kilka głównych punktów: (1) Żadne „dane” nigdy nie mogą być normalnie rozpowszechniane. Dane są z konieczności dyskretne. Prawidłowe pytanie brzmi: „czy proces, który wytworzył dane, jest procesem normalnie rozproszonym?” Ale (2) odpowiedź na drugie pytanie brzmi zawsze „nie”, niezależnie od tego, co daje ci test statystyczny lub inna ocena oparta na danych. Normalnie rozproszone procesy wytwarzają dane z nieskończoną ciągłością, idealną symetrią i precyzyjnie określonymi prawdopodobieństwami w standardowych zakresach odchyleń (np. 68-95-99,7), z których żaden nie jest nigdy dokładnie zgodny z procesami, które dają podstawę do danych, które możemy zmierzyć czymkolwiek urządzenie pomiarowe, którego ludzie mogą używać.
Tak więc nigdy nie można uznać, że dane są normalnie dystrybuowane, i nigdy nie można uważać procesu, który wytworzył dane, za dokładnie precyzyjnie rozproszony proces. Ale, jak wskazał Glen_b, może to nie mieć większego znaczenia, w zależności od tego, co próbujesz zrobić z danymi.
Statystyki skośności i kurtozy mogą pomóc ocenić pewne rodzaje odchyleń od normalności procesu generowania danych. Są to jednak bardzo zmienne statystyki. Podane powyżej standardowe błędy są nieprzydatne, ponieważ są prawidłowe tylko w normalności, co oznacza, że są użyteczne jedynie jako test normalności, ćwiczenie zasadniczo bezużyteczne. Lepiej byłoby użyć bootstrapu, aby znaleźć se, chociaż duże próbki byłyby potrzebne, aby uzyskać dokładne se.
Również kurtoza jest bardzo łatwa do interpretacji, w przeciwieństwie do powyższego postu. Jest to średnia (lub oczekiwana wartość) wartości Z, każda wzięta do czwartej potęgi. Large | Z | wartości są wartościami odstającymi i w znacznym stopniu przyczyniają się do kurtozy. Small | Z | wartości, gdzie „szczyt” rozkładu, daje wartości Z ^ 4, które są małe i nie przyczyniają się zasadniczo do kurtozy. W moim artykule https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4321753/ udowodniłem, że kurtoza jest bardzo dobrze przybliżona przez średnią wartości Z ^ 4 * I (| Z |> 1). Dlatego kurtoza mierzy skłonność procesu generowania danych do generowania wartości odstających.