Zamiast polegać na teście normalności reszt, spróbuj ocenić normalność za pomocą racjonalnego osądu. Testy normalności nie mówią, że twoje dane są normalne, tylko że tak nie jest. Ale biorąc pod uwagę, że dane są próbką, możesz być całkiem pewien, że nie są normalne bez testu. Wymaganie jest w przybliżeniu normalne. Test nie może ci tego powiedzieć. Testy również stają się bardzo czułe przy dużych N lub poważniej, różnią się czułością z N. Twoje N znajduje się w tym zakresie, w którym czułość zaczyna być wysoka. Jeśli uruchomisz następującą symulację w R kilka razy i spojrzysz na wykresy, zobaczysz, że test normalności mówi „nie normalny” na dobrej liczbie rozkładów normalnych.
# set the plot area to show two plots side by side (make the window wide)
par(mfrow = c(1, 2))
n <- 158 # use the N we're concerned about
# Run this a few times to get an idea of what data from a
# normal distribution should look like.
# especially note how variable the histograms look
y <- rnorm(n) # n numbers from normal distribution
# view the distribution
hist(y)
qqnorm(y);qqline(y)
# run this section several times to get an idea what data from a normal
# distribution that fails the normality test looks like
# the following code block generates random normal distributions until one
# fails a normality test
p <- 1 # set p to a dummy value to start with
while(p >= 0.05) {
y <- rnorm(n)
p <- shapiro.test(y)$p.value }
# view the distribution that failed
hist(y)
qqnorm(y);qqline(y)
Mam nadzieję, że po przejściu symulacji można zobaczyć, że test normalności może łatwo odrzucić dość normalnie wyglądające dane, a dane z rozkładu normalnego mogą wyglądać dość dalekie od normalnych. Jeśli chcesz zobaczyć ekstremalną wartość tej próby n <- 1000
. Wszystkie rozkłady będą wyglądać normalnie, ale nadal nie powiedzie się test z mniej więcej taką samą szybkością jak niższe wartości N. I odwrotnie, przy niskich rozkładach N, które przejdą test, mogą wyglądać bardzo dalekie od normalnych.
Standardowy wykres resztkowy w SPSS nie jest szczególnie przydatny do oceny normalności. Widać wartości odstające, zasięg, dobro dopasowania, a może nawet dźwignię. Trudno jednak wyprowadzić z tego normalność. Wypróbuj następującą symulację porównując histogramy, normalne wykresy kwantylowo-kwantylowe i wykresy resztkowe.
par(mfrow = c(1, 3)) # making 3 graphs in a row now
y <- rnorm(n)
hist(y)
qqnorm(y); qqline(y)
plot(y); abline(h = 0)
Niezwykle trudno jest odróżnić normalność lub wiele innych rzeczy od ostatniego wątku, a zatem nie jest to straszna diagnoza normalności.
Podsumowując, ogólnie zaleca się, aby nie polegać na testach normalności, ale raczej na wykresach diagnostycznych reszt. Bez tych wykresów lub rzeczywistych wartości w twoim pytaniu bardzo trudno jest każdemu udzielić rzetelnej porady na temat potrzebnych danych w zakresie analizy lub transformacji. Aby uzyskać najlepszą pomoc, podaj nieprzetworzone dane.