Czy jest jakiś test statystyczny, który jest parametryczny i nieparametryczny? To pytanie zadał panel wywiadu. Czy to ważne pytanie?
Czy jest jakiś test statystyczny, który jest parametryczny i nieparametryczny? To pytanie zadał panel wywiadu. Czy to ważne pytanie?
Odpowiedzi:
Zasadniczo trudno jest dokładnie powiedzieć, co należy rozumieć przez „test parametryczny” i „test nieparametryczny”, choć istnieje wiele konkretnych przykładów, w których większość zgadza się co do tego, czy test jest parametryczny czy nieparametryczny (ale nigdy oba) . Szybkie wyszukiwanie dało tę tabelę , która, jak sądzę, stanowi powszechne praktyczne rozróżnienie w niektórych obszarach między testami parametrycznymi i nieparametrycznymi.
Tuż nad tabelą, o której mowa, jest uwaga:
„... dane parametryczne mają podstawowy rozkład normalny… Wszystko inne jest nieparametryczne”.
Może być przyjętym kryterium w niektórych obszarach, w których albo zakładamy normalność i używamy ANOVA, i jest to parametryczne, albo nie zakładamy normalności i używamy alternatyw nieparametrycznych.
Być może nie jest to bardzo dobra definicja i moim zdaniem nie jest naprawdę poprawna, ale może być praktyczną zasadą. Głównie dlatego celem samym w naukach społecznych, powiedzmy, jest analiza danych, a co dobre, jest to, aby móc sformułować parametrycznego modelu opartego na zasadzie braku rozkładu normalnego, a następnie nie być w stanie analizować dane?
Alternatywną definicją jest zdefiniowanie „testów nieparametrycznych” jako testów, które nie opierają się na założeniach dystrybucyjnych i testach parametrycznych.
Pierwsza i druga z przedstawionych definicji definiuje jedną klasę testów, a następnie definiuje drugą klasę jako uzupełnienie (cokolwiek innego). Z definicji wyklucza to, że test może być zarówno parametryczny, jak i nieparametryczny.
Prawda jest taka, że ta druga definicja jest problematyczna. Co jeśli istnieją pewne naturalne założenia „nieparametryczne”, takie jak symetria, które można narzucić? Czy to przekształci statystykę testową, która w innym przypadku nie opiera się na jakichkolwiek założeniach dystrybucyjnych, w test parametryczny? Większość powiedziałaby „nie”!
Stąd istnieją testy w klasie testów nieparametrycznych, które mogą przyjmować pewne założenia dystrybucyjne o ile nie są one „zbyt parametryczne”. Granica między testami „parametrycznymi” i „nieparametrycznymi” zatarła się, ale wierzę, że większość potwierdzi, że albo test ma charakter parametryczny, albo nieparametryczny, być może nie może być niczym innym, jak stwierdzeniem, że oba są jednocześnie nie ma sensu.
Z innego punktu widzenia wiele testów parametrycznych to (równoważne) testy współczynnika wiarygodności. Umożliwia to ogólną teorię i mamy jednolite zrozumienie właściwości dystrybucyjnych testów współczynnika wiarygodności w odpowiednich warunkach prawidłowości. Wręcz przeciwnie, testy nieparametryczne nie są równoznaczne z testami współczynnika wiarygodności per se nie ma prawdopodobieństwa i bez metodologii ujednolicania opartej na prawdopodobieństwie musimy uzyskiwać wyniki dystrybucji indywidualnie dla każdego przypadku. Teoria prawdopodobieństwa empirycznego- pOpracowany głównie przez Art Owena ze Stanford jest jednak bardzo interesującym kompromisem. Oferuje podejście do statystyki oparte na prawdopodobieństwie (co jest dla mnie ważnym punktem, ponieważ uważam prawdopodobieństwo za ważniejszy obiekt niż , powiedzmy, wartość ), bez potrzeby typowych parametrycznych założeń dystrybucyjnych. Podstawową ideą jest sprytne wykorzystanie wielomianowego rozkładu danych empirycznych, metody są bardzo „parametryczne”, ale aktualne, bez ograniczania założeń parametrycznych.
Testy oparte na prawdopodobieństwie empirycznym mają, według IMHO, zalety testów parametrycznych i ogólność testów nieparametrycznych, stąd wśród testów, o których mogę myśleć, są one najbliższe do zakwalifikowania do bycia parametrycznymi i nieparametrycznymi, chociaż nie używaj tej terminologii.
Parametryczny jest używany (co najmniej) w dwóch znaczeniach: A - Aby zadeklarować, że przyjmujesz rodzinę rozkładu hałasu do jej parametrów. B - Aby zadeklarować, że zakładasz konkretny funkcjonalny związek między zmiennymi objaśniającymi a wynikiem.
Kilka przykładów:
Termin „półparametryczny” zwykle odnosi się do przypadku B i oznacza, że nie przyjmujesz całej zależności funkcjonalnej, ale raczej masz łagodniejsze założenia, takie jak „addytywny w pewnej płynnej transformacji predyktorów”.
Można również przyjąć łagodniejsze założenia dotyczące rozkładu hałasu, takie jak „wszystkie momenty są skończone”, bez konkretnego określenia kształtu rozkładu. Według mojej najlepszej wiedzy nie ma terminu na takie założenie.
Należy zauważyć, że odpowiedź dotyczy podstawowych założeń leżących u podstaw procesu generowania danych. Mówiąc „test aparametryczny”, zwykle mówi się o znaczeniu nieparametrycznym w sensie A. W tym właśnie miałeś na myśli, wtedy odpowiedziałbym „nie”. Niemożliwe byłoby bycie parametrycznym i nieparametrycznym w tym samym sensie w tym samym czasie.
Przypuszczam, że to zależy od tego, co rozumieją przez „parametryczny i nieparametryczny”? Jednocześnie dokładnie jedno, czy połączenie dwóch?
Wiele osób uważa proporcjonalny model zagrożeń Coxa za parametr półparametryczny, ponieważ nie szacuje parametrycznie hazardu podstawowego.
Możesz też wyświetlić wiele statystyk nieparametrycznych jako faktycznie masywnych parametrycznie.
Bradley w swoich klasycznych testach statystycznych bez dystrybucji (1968, s. 15–16 - patrz to pytanie ), wyjaśnia różnicę między testami bez dystrybucji i testami nieparametrycznymi , które, jak twierdzi, są często ze sobą powiązane, i daje przykład parametrycznego testu bez dystrybucji jako testu znaku dla mediany. W tym teście nie przyjmuje się założeń dotyczących podstawowego rozkładu populacji zmiennych o różnych wartościach, więc nie ma w nim dystrybucji . Jednak, jeśli wybrano mediana poprawne wartości powyżej i poniżej, należy dobrać w równym prawdopodobieństwem badania losowych próbek z
Aktualizacja