Strona Wikipedii na temat ANOVA wymienia trzy założenia , a mianowicie:
- Niezależność przypadków - jest to założenie modelu upraszczającego analizę statystyczną.
- Normalność - rozkłady reszt są normalne.
- Równość (lub „jednorodność”) wariancji, zwana homoscedastycznością ...
Punkt zainteresowania jest tutaj drugim założeniem. Kilka źródeł wylicza założenie inaczej. Niektórzy mówią o normalności surowych danych, inni twierdzą, że są to resztki.
Pojawia się kilka pytań:
- czy normalność i normalny rozkład reszt to ta sama osoba (na podstawie wpisu w Wikipedii twierdziłbym, że normalność jest własnością i nie dotyczy bezpośrednio reszt (ale może być właściwością reszt (głęboko zagnieżdżony tekst w nawiasach, dziwaczny)))?
- jeśli nie, jakie założenie należy przyjąć? Jeden? Obie?
- jeśli założenie o normalnie rozłożonych resztach jest słuszne, czy popełniamy poważny błąd, sprawdzając tylko histogram wartości surowych pod kątem normalności?