Jaka jest różnica między testem normalności Shapiro-Wilka a testem normalności Kołmogorowa-Smirnowa? Kiedy wyniki tych dwóch metod będą się różnić?
Jaka jest różnica między testem normalności Shapiro-Wilka a testem normalności Kołmogorowa-Smirnowa? Kiedy wyniki tych dwóch metod będą się różnić?
Odpowiedzi:
Tak naprawdę nie można nawet porównać tych dwóch, ponieważ Kołmogorow-Smirnov jest dla całkowicie określonego rozkładu (więc jeśli testujesz normalność, musisz określić średnią i wariancję; nie można ich oszacować na podstawie danych *), podczas gdy Shapiro-Wilk jest dla normalności, z nieokreśloną średnią i wariancją.
* nie można również standaryzować za pomocą szacunkowych parametrów i testować standardową normę; to właściwie to samo.
Jednym ze sposobów porównania byłoby uzupełnienie Shapiro-Wilka testem dla określonej średniej i wariancji w normie (łączenie testów w pewien sposób) lub dostosowanie tabel KS do oszacowania parametru (ale wtedy nie jest to już rozkład -wolny).
Istnieje taki test (odpowiednik Kołmogorowa-Smirnowa o szacowanych parametrach) - test Lillieforsa; wersja testowa normalności mogłaby zostać poprawnie porównana z Shapiro-Wilkiem (i ogólnie będzie miała mniejszą moc). Bardziej konkurencyjny jest test Andersona-Darlinga (który również musi zostać skorygowany w celu oszacowania parametrów, aby porównanie było ważne).
Jeśli chodzi o to, co testują - test KS (i Lilliefors) sprawdza największą różnicę między empirycznym CDF a określonym rozkładem, podczas gdy Shapiro Wilk skutecznie porównuje dwie oceny wariancji; ściśle powiązany Shapiro-Francia można uznać za funkcję monotoniczną korelacji do kwadratu na wykresie QQ; jeśli dobrze pamiętam, Shapiro-Wilk bierze również pod uwagę kowariancje między statystykami zamówień.
Zredagowano, aby dodać: Podczas gdy Shapiro-Wilk prawie zawsze pokonuje test Lilliefors na temat alternatywnych interesujących alternatyw, przykładem tego nie jest w średnich i dużych próbkach ( -ish). Tam Lilliefors ma większą moc.
[Należy pamiętać, że dostępnych jest znacznie więcej testów normalności niż te.]
hist(replicate(1000,ks.test(scale(rnorm(x)),pnorm)$p.value))
- jeśli wartości p byłyby takie, jakie powinny być, wyglądałoby to jednolicie!
Krótko mówiąc, test Shapiro-Wilka jest swoistym testem na normalność, podczas gdy metoda zastosowana w teście Kołmogorowa-Smirnowa jest bardziej ogólna, ale słabsza (co oznacza, że rzadziej poprawnie odrzuca hipotezę zerową o normalności). Obie statystyki przyjmują normalność jako wartość zerową i ustanawiają statystyki testowe na podstawie próbki, ale sposób, w jaki to robią, różni się od siebie w sposób, który czyni je mniej lub bardziej wrażliwe na cechy rozkładów normalnych.
To, jak dokładnie oblicza się W (statystykę testową dla Shapiro-Wilka), jest nieco zaangażowane , ale koncepcyjnie obejmuje szeregowanie wartości próbek według wielkości i mierzenie dopasowania względem oczekiwanych średnich, wariancji i kowariancji. Te wielokrotne porównania z normalnością, jak rozumiem, dają testowi więcej mocy niż test Kołmogorowa-Smirnowa, który jest jednym ze sposobów, w jaki mogą się one różnić.
Z kolei test normalności Kołmogorowa-Smirnowa wywodzi się z ogólnego podejścia do oceny dobroci dopasowania poprzez porównanie oczekiwanego skumulowanego rozkładu z empirycznym skumulowanym rozkładem, względem:
Jako taki jest wrażliwy w środku rozkładu, a nie na ogonach. Jednak KS jest testem zbieżnym, w tym sensie, że skoro n dąży do nieskończoności, test zbiega się z prawdziwą odpowiedzią z prawdopodobieństwem (uważam, że ma tu zastosowanie twierdzenie Glivenko-Cantelli , ale ktoś może mnie poprawić). Są jeszcze dwa sposoby, w jakie te dwa testy mogą różnić się w ocenie normalności.