Tendencję centralną, rozprzestrzenianie się i skośność można określić stosunkowo dobrze, przynajmniej intuicyjnie; standardowe matematyczne miary tych rzeczy również stosunkowo dobrze odpowiadają naszym intuicyjnym pojęciom. Ale kurtoza wydaje się inna. Jest to bardzo mylące i nie pasuje do żadnej intuicji dotyczącej kształtu dystrybucji.
Typowym wyjaśnieniem kurtozy w zastosowanym ustawieniu byłby ten wyciąg ze Statystyk stosowanych w biznesie i zarządzaniu za pomocą Microsoft Excel [ 1 ] :
Kurtosis odnosi się do tego, jak szczytowy jest rozkład lub odwrotnie, jak jest płaski. Jeśli w ogonach jest więcej wartości danych, niż można oczekiwać od rozkładu normalnego, kurtoza jest dodatnia. I odwrotnie, jeśli w ogonach jest mniej wartości danych, niż można by oczekiwać w normalnym rozkładzie, kurtoza jest ujemna. Excel nie może obliczyć tej statystyki, chyba że masz co najmniej cztery wartości danych.
Oprócz zamieszania między „kurtozą” a „nadmierną kurtozą” (jak w tej książce, często używa się tego pierwszego słowa w odniesieniu do tego, co inni nazywają drugim), interpretacji w kategoriach „szczytowości” lub „płaskości” jest wtedy zagmatwany przez przestawienie uwagi na to, ile elementów danych znajduje się w ogonach. Biorąc pod uwagę zarówno „szczyt”, jak i „ogony”, konieczne jest - Kaplanskynarzekał w 1945 r., że wiele ówczesnych podręczników błędnie twierdziło, że kurtoza ma związek z tym, jak wysoki jest szczyt rozkładu w porównaniu z rozkładem normalnym, bez uwzględnienia ogona. Ale wyraźne uwzględnienie kształtu zarówno na szczycie, jak i na ogonach sprawia, że intuicja jest trudniejsza do zrozumienia, punkt, o którym cytowany powyżej fragment pomija, przechodząc od szczytowości do ciężkości ogonów, jakby te koncepcje były takie same.
Co więcej, to klasyczne wyjaśnienie kurtozy z „piku i ogona” działa dobrze tylko w przypadku rozkładów symetrycznych i nieimodalnych (w rzeczywistości wszystkie przykłady ilustrowane w tym tekście są symetryczne). Jednak „poprawny” ogólny sposób interpretacji kurtozy, czy to w kategoriach „szczytów”, „ogonów” czy „ramion”, jest kwestionowany od dziesięcioleci .
Czy istnieje intuicyjny sposób nauczania kurtozy w zastosowanym otoczeniu, który nie uderzy w sprzeczności lub kontrprzykłady, gdy zastosuje się bardziej rygorystyczne podejście? Czy kurtoza jest w ogóle użyteczną koncepcją w kontekście tego rodzaju kursów analizy danych stosowanych, w przeciwieństwie do klas statystyki matematycznej? Jeśli „szczytowość” rozkładu jest intuicyjnie użyteczną koncepcją, czy powinniśmy uczyć go za pomocą chwil L ?
Herkenhoff, L. i Fogli, J. (2013). Statystyka stosowana w biznesie i zarządzaniu za pomocą Microsoft Excel. New York, NY: Springer.
Kaplansky, I. (1945). „Częsty błąd dotyczący kurtozy”. Journal of American Statistics Association,40(230): 259.
Darlington, Richard B (1970). „Czy Kurtosis jest naprawdę„ szczytem ”?”. The American Statistician24(2): 19–22
Moors, JJA. (1986) „Ponownie zbadane znaczenie kurtosis: Darlington”. The American Statistician40(4): 283–284
Balanda, Kevin P. i MacGillivray, HL (1988). „Kurtosis: A Critical Review”. The American Statistician 42(2): 111–119
DeCarlo, LT (1997). „O znaczeniu i zastosowaniu kurtozy”. Metody psychologiczne,2(3), 292. Chicago
Hosking, JRM (1992). „Chwile czy chwile L? Przykład porównujący dwie miary kształtu dystrybucyjnego”. The American Statistician46(3): 186–189