Jakie są standardowe testy statystyczne, aby sprawdzić, czy dane są zgodne z rozkładem wykładniczym czy normalnym?
Jakie są standardowe testy statystyczne, aby sprawdzić, czy dane są zgodne z rozkładem wykładniczym czy normalnym?
Odpowiedzi:
Wygląda na to, że próbujesz zdecydować, czy modelować dane przy użyciu rozkładu normalnego czy wykładniczego. Wydaje mi się to nieco dziwne, ponieważ te rozkłady są bardzo różne od siebie.
Rozkład normalny jest symetryczny, podczas gdy rozkład wykładniczy jest mocno przekrzywiony w prawo, bez wartości ujemnych. Zwykle próbka z rozkładu wykładniczego będzie zawierać wiele uwag stosunkowo blisko do i kilka obervations które odbiegają daleko na prawo od . Różnicę tę często łatwo dostrzec graficznie.0
Oto przykład, w którym symulowałem obserwacji z rozkładu normalnego ze średnią i wariancją oraz rozkład wykładniczy ze średnią i wariancją :2 4 2 4
Symetrię rozkładu normalnego i skośność wykładniczego można zobaczyć za pomocą histogramów, wykresów pudełkowych i wykresów rozrzutu, jak pokazano na powyższym rysunku.
Kolejnym bardzo przydatnym narzędziem jest wykres QQ . W poniższym przykładzie punkty powinny w przybliżeniu podążać za linią, jeśli próbka pochodzi z rozkładu normalnego. Jak widać, dotyczy to normalnych danych, ale nie danych wykładniczych.
Jeśli z jakiegoś powodu badanie graficzne nie jest dla Ciebie wystarczające, możesz nadal użyć testu, aby ustalić, czy rozkład jest normalny czy wykładniczy. Ponieważ rozkład normalny jest skalą i rodziną lokalizacji, będziesz chciał użyć testu niezmiennego przy zmianach skali i lokalizacji (tj. Wynik testu nie powinien ulec zmianie, jeśli zmienisz swoje pomiary z cali na centymetry lub dodasz do wszystkich twoich obserwacji).
Kiedy hipoteza zerowa mówi, że rozkład jest normalny, a hipoteza alternatywna jest wykładnicza, najsilniejszym testem niezmiennym lokalizacji i skali jest statystyka gdzie jest średnią próbki, jest najmniejszą obserwacją w próbce, a jest odchyleniem standardowym próbki. Normalność jest odrzucana na korzyść wykładniczej, jeśli jest zbyt duży.ˉ x x(1)sTE,N
Ten test jest w rzeczywistości jednostronną wersją testu Grubbsa na wartości odstające . Znajdziesz to zaimplementowane w większości programów statystycznych (ale upewnij się, że używasz odpowiedniej wersji - istnieje kilka alternatywnych statystyk testowych używanych do testu wartości odstających!).
Odniesienie do będącego najsilniejszym testem: sekcja 4.2.4 badania normalności metodą HC Thode.
Do rozkładu wykładniczego możesz użyć testu o nazwie test Morana lub Bartletta. Statystyka testowa obejmuje średnią próbną a także średnią próbną zarejestrowanego Pod hipotezą zerową mamy około i dwustronny test działa. Ten test został opracowany dla alternatywnych gamma.¯ Y ¯ log Y Y i B n = b n × { log ˉ Y - ¯ log Y } B n ∼ χ 2 ( n - 1 )
Patrz KC Kapur i LR Lamberson Niezawodność w projektowaniu inżynierskim . Wiley 1977.
Do normalności Anderson-Darling i Shapiro-Wilk są uważani za najlepszych. Do wykładniczego testu Lillerforsa został zaprojektowany specjalnie dla niego.
Czy zastanawiałeś się nad metodami graficznymi, aby zobaczyć, jak zachowują się dane?
Techniki wykresu prawdopodobieństwa zwykle obejmują uszeregowanie danych, zastosowanie odwrotnego CDF, a następnie wykreślenie wyników na płaszczyźnie kartezjańskiej. Pozwala to zobaczyć, czy kilka wartości odbiega od hipotetycznego rozkładu i ewentualnie wyjaśnia przyczynę tego odchylenia.