„Więzy nie powinny być obecne” w teście Kołmgorowa-Smirnowa na jednej próbce w R.


12

Zamierzam użyć testu Kołmogorowa-Smirnowa, aby przetestować normalność MYDATA w R. To jest przykład tego, co robię

 ks.test(MYDATA,"pnorm",mean(MYDATA),sd(MYDATA))

Oto wynik R daje mi:

 data:  MYDATA
 D = 0.13527, p-value = 0.1721
 alternative hypothesis: two-sided

 Warning message:
 In ks.test(MYDATA, "pnorm", mean(MYDATA), sd(MYDATA)) :
    ties should not be present for the Kolmogorov-Smirnov test

Myślę, że jest problem, co oznaczają „krawaty” w tym ostrzeżeniu?


2
Dlaczego chcesz wykonać ten test normalności? W większości przypadków testowanie normalności zmiennej jest dość bezużyteczne , chociaż testowanie normalności reszt po regresji może być ważne.
EdM

2
Nawet bez powiązań test KS nie jest testem na ogólną normalność, ale na w pełni określony rozkład (szacujesz średnią i odchylenie standardowe na podstawie danych). Twoje wartości p będą nonsensowne. Przeszukaj naszą stronę, aby znaleźć odniesienia do testu Lilliefors
Glen_b

Odpowiedzi:


10

Masz tutaj dwa problemy:

Test KS służy do ciągłego rozkładu, dlatego MYDATA nie powinna zawierać żadnych powiązań (wartości powtarzanych).

Teoria leżąca u podstaw testu KS nie pozwala oszacować parametrów rozkładu na podstawie danych, tak jak to zrobiłeś. Wyjaśnia to pomoc dla ks.test.


dlaczego ks.testw przypadku dwóch próbek chce się usunąć więzi z obu xi y? To znaczy, że nie mają wiąże się xi y( unique(x)a unique(y)), lecz te dwa wektory wartości wspólnych. Czy więzi nie powinny być brane pod uwagę tylko wśród wartości w xi do y?
Nemesi

@Nemesi, jeśli masz nowe pytanie, zadaj je jako takie za pomocą przycisku Zadaj pytanie.
mdewey

Myślałem, że to nie wystarczy, aby być innym pytaniem, ale oto: stats.stackexchange.com/questions/389151/…
Nemesi

5

Jak wyjaśniono przez @mdewey, test KS nie jest odpowiedni przy szacowaniu parametrów na podstawie danych. Możesz użyć następującego kodu, który opiera się na teście normalności Andersona-Darlinga i nie wymaga podania średniej i standardowej wartości standardowej. Ten test ma większą dokładność niż test Lilliefors.

install.packages("nortest")
library(nortest)
ad.test(MYDATA)

„Dokładność” może dotyczyć wąskiego, ale błędnego wyszukiwania. W obu przypadkach większość zastosowań któregokolwiek z tych testów jest w najgorszym przypadku bezużyteczna, aw większości przypadków wprowadzająca w błąd. Ludzie często uczą się korzystania z nich przez osoby, które źle rozumieją założenia dotyczące metod regresji. Podejrzewam, że względna słabość testu KS sprawiłaby, że faktycznie „lepiej” byłoby zastosować mocniejsze alternatywy, ponieważ jego wyniki byłyby mniej mylące dla naiwnego użytkownika.
DW
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.