Co dokładnie wykonuje test nieparametryczny i co robisz z wynikami?


22

Mam wrażenie, że można było o to zapytać gdzie indziej, ale nie tak naprawdę z rodzajem podstawowego opisu, którego potrzebuję. Wiem, że nieparametryczny polega na medianie zamiast na średniej do porównywania ... czegoś. Wierzę również, że opiera się na „stopniach swobody” (?) Zamiast standardowego odchylenia. Popraw mnie, jeśli się mylę.

Zrobiłem całkiem niezłe badania, a przynajmniej tak mi się wydawało, próbując zrozumieć koncepcję, co za tym stoją, co naprawdę oznaczają wyniki testu i / lub co zrobić z wynikami testu; jednak wydaje się, że nikt nigdy nie zapuszcza się w ten obszar.

Dla uproszczenia trzymajmy się testu U Manna-Whitneya, który zauważyłem, że jest dość popularny (a także pozornie niewłaściwie wykorzystywany i nadużywany, aby zmusić swój „kwadratowy model do otworu w okręgu”). Jeśli chcesz opisać również inne testy, nie krępuj się, chociaż czuję, że kiedy je rozumiem, mogę zrozumieć inne w analogiczny sposób w stosunku do różnych testów t itp.

Załóżmy, że uruchamiam test nieparametryczny z moimi danymi i otrzymuję ten wynik:

2 Sample Mann-Whitney - Customer Type       

Test Information        
H0: Median Difference = 0       
Ha: Median Difference ≠ 0       

Size of Customer    Large   Small
Count                    45    55
Median                    2     2

Mann-Whitney Statistic: 2162.00 
p-value (2-sided, adjusted for ties):   0.4156  

Znam inne metody, ale co tu jest inne? Czy chcemy, aby wartość p była niższa niż 0,05? Co oznacza „statystyka Manna-Whitneya”? Czy ma to jakiś sens? Czy te informacje tutaj tylko weryfikują, czy nie weryfikują, czy dane źródło, które posiadam, powinno zostać użyte?

Mam spore doświadczenie z regresją i podstawami, ale jestem bardzo ciekawy tego „specjalnego” nieparametrycznego materiału - który, jak wiem, będzie miał swoje wady.

Wyobraź sobie, że jestem piątą równiarką i sprawdź, czy możesz mi to wyjaśnić.


4
Tak, czytałem to wiele razy. Czasami żargon, którego używa wikipedia, może stać się przytłaczający i chociaż ma dokładny opis - niekoniecznie musi mieć jasny opis dla kogoś, kto zaczyna się uczyć tego obszaru. Nie jestem pewien, kto przegłosował, ale słusznie chcę tylko podstawowe, CZYSTE wyjaśnienie, które prawie każdy może zrozumieć. Tak, starałem się znaleźć kogoś, kto w to wierzy lub nie. Nie ma potrzeby natychmiastowego głosowania na mnie i linkowania do wikipedii. Czy ktoś kiedykolwiek zauważył, że niektórzy nauczyciele są lepsi od innych? Szukam dobrego „nauczyciela” dla koncepcji, na której utknąłem.
Taal

1
Następnie przejdź do dobrego podstawowego tekstu statystyki nieparametrycznej, takiego jak Sprent i Smeeton, Hollander i Wolfe, Conover. lub znajdź tekst wprowadzający, który zawiera Mann-Whitney.
Nick Cox,

1
Patrząc na twoje pytanie i inne pytanie, które zadałeś ostatnio za pomocą samego Internetu, nie działa dobrze, ponieważ jesteś wyraźnie zdezorientowany. Właśnie dlatego @Peter Flom i ja polecamy książki. Nie mam innych sugestii w rezerwie. Poleciłbym również - szczerze iw twoim najlepszym interesie - starać się pisać o wiele bardziej zwięzłe, mniej gadatliwe pytania. Twój dygresyjny styl nie pomaga wyjaśnić twoich pytań.
Nick Cox,

1
Sam Internet działa właściwie lepiej niż jakakolwiek książka lub klasa, która była dla mnie szczera - i to dotyczy każdego tematu. Przepraszam za pisanie „gadatliwych” pytań.
Taal

3
Nie, wydaje się, że nie działa tak dobrze, jak dobra książka. Parafrazując Stephena Senna, dziwne jest, że statystyki są jedyną nauką, jakiej ludzie oczekują od zrozumienia na pierwszy rzut oka.
Frank Harrell,

Odpowiedzi:


41

Wiem, że nieparametryczne opiera się na medianie zamiast na średniej

W tym sensie prawie żadne testy nieparametryczne „polegają” na medianach. Mogę tylko pomyśleć o parze ... i jedyną, o której spodziewam się, że prawdopodobnie usłyszycie, będzie test znaku.

porównać ... coś.

Gdyby polegali na medianach, prawdopodobnie byłoby to porównanie median. Ale - pomimo wielu źródeł, które próbują ci powiedzieć - testy takie jak podpisany test rangowy, Wilcoxon-Mann-Whitney lub Kruskal-Wallis wcale nie są testem median; jeśli podejmiesz dodatkowe założenia, możesz traktować Wilcoxona-Manna-Whitneya i Kruskala-Wallisa jako testy median, ale przy tych samych założeniach (o ile istnieją środki dystrybucyjne), możesz równie dobrze traktować je jako test średnich .

Rzeczywista szacunkowa lokalizacja istotna dla testu Rangi Podpisanej jest medianą średnich par w próbie, tą dla Wilcoxona-Manna-Whitneya (i, w konsekwencji, w Kruskal-Wallis), jest medianą różnic par między próbkami .

Wierzę też, że opiera się na „stopniach swobody?” zamiast odchylenia standardowego. Popraw mnie, jeśli się mylę.

Większość testów nieparametrycznych nie ma „stopni swobody”, chociaż rozkład wielu zmienia się wraz z wielkością próbki i można uznać, że jest to nieco podobne do stopni swobody w tym sensie, że tabele zmieniają się wraz z wielkością próbki. Próbki oczywiście zachowują swoje właściwości i mają w tym sensie n stopni swobody, ale stopnie swobody w rozkładzie statystyki testowej zwykle nie są czymś, co nas interesuje. Może się zdarzyć, że masz coś w rodzaju stopni swobody - na przykład możesz z pewnością argumentować, że Kruskal-Wallis ma stopnie swobody w zasadzie w tym samym sensie, co ma kwadrat chi, ale zwykle nie jest to analizowane w ten sposób (na przykład, jeśli ktoś mówi o stopniach swobody Kruskala-Wallisa, prawie zawsze będzie oznaczał df

Dobrą dyskusję na temat stopni swobody można znaleźć tutaj /

Zrobiłem całkiem niezłe badania, a przynajmniej tak myślałem, próbując zrozumieć koncepcję, co za tym stoją, co naprawdę oznaczają wyniki testu i / lub co zrobić z wynikami testu; jednak wydaje się, że nikt nigdy nie zapuszcza się w ten obszar.

Nie jestem pewien, co przez to rozumiesz.

Mógłbym zasugerować kilka książek, takich jak Praktyczna nieparametryczna statystyka Conovera , a jeśli możesz ją zdobyć, książkę Neave'a i Worthingtona ( testy bez dystrybucji ), ale jest wiele innych - na przykład Marascuilo i McSweeney, Hollander i Wolfe, lub książka Daniela. Sugeruję, abyś przeczytał co najmniej 3 lub 4 z tych, które mówią do ciebie najlepiej, najlepiej te, które wyjaśniają wszystko tak różnie, jak to możliwe (oznaczałoby to przynajmniej przeczytanie trochę 6 lub 7 książek, aby znaleźć powiedzmy 3, które pasują).

Dla uproszczenia trzymajmy się testu U Manna Whitneya, który, jak zauważyłem, jest dość popularny

Właśnie to mnie zdziwiło w twoim stwierdzeniu „wydaje się, że nikt nigdy nie zapuszcza się w ten obszar” - wiele osób korzystających z tych testów „zapuszcza się w obszar”, o którym mówiłeś.

- a także pozornie niewłaściwie i nadużywane

Powiedziałbym, że testy nieparametryczne są na ogół niedostatecznie wykorzystywane, jeśli cokolwiek (w tym Wilcoxon-Mann-Whitney) - szczególnie testy permutacji / randomizacji, chociaż niekoniecznie kwestionowałbym to, że są często niewłaściwie wykorzystywane (ale tak samo są testy parametryczne, nawet bardziej).

Powiedzmy, że uruchamiam test nieparametryczny z moimi danymi i otrzymuję ten wynik:

[fantastyczna okazja]

Znam inne metody, ale co tu jest inne?

Jakie inne metody masz na myśli? Z czym chcesz to porównać?

Edycja: Później wspominasz o regresji; Zakładam, że znasz dwupróbkowy test t (ponieważ jest to naprawdę szczególny przypadek regresji).

Zgodnie z założeniami zwykłego testu t dla dwóch prób hipoteza zerowa głosi, że dwie populacje są identyczne, w przeciwieństwie do alternatywy przesunięcia jednego z rozkładów. Jeśli spojrzysz na pierwszy z dwóch zestawów hipotez dotyczących Wilcoxona-Manna-Whitneya poniżej, podstawowa testowana tam rzecz jest prawie identyczna; po prostu test t opiera się na założeniu, że próbki pochodzą z identycznych rozkładów normalnych (oprócz możliwego przesunięcia lokalizacji). Jeśli hipoteza zerowa jest prawdziwa, a towarzyszące jej założenia są prawdziwe, statystyka testowa ma rozkład t. Jeśli hipoteza alternatywna jest prawdziwa, wówczas statystyki testowe stają się bardziej prawdopodobne, że przyjmują wartości, które nie wyglądają spójnie z hipotezą zerową, ale wyglądają spójnie z alternatywą - skupiamy się na najbardziej niezwykłych,

Sytuacja jest bardzo podobna w przypadku Wilcoxona-Manna-Whitneya, ale nieco inaczej mierzy odchylenie od zera. W rzeczywistości, gdy założenia testu t są prawdziwe *, jest ono prawie tak dobre, jak najlepszy możliwy test (którym jest test t).

* (co w praktyce nigdy nie jest, choć nie jest to tak poważny problem, jak się wydaje)

wmw poniżej wartości zerowej i alternatywa

Rzeczywiście, można uznać Wilcoxona-Manna-Whitneya za skutecznie „test t” wykonywany na szeregach danych - chociaż wtedy nie ma on rozkładu t; statystyka jest monotoniczną funkcją dwupróbkowej statystyki t obliczonej na szeregach danych, więc indukuje to samo uporządkowanie ** w przestrzeni próbki (tj. „test t” na szeregach - odpowiednio przeprowadzony - wygenerowałaby te same wartości p, co Wilcoxon-Mann-Whitney), więc odrzuca dokładnie te same przypadki.

** (ściśle, częściowe zamawianie, ale odłóżmy to na bok)

[Można by pomyśleć, że samo użycie szeregów wyrzuciłoby wiele informacji, ale gdy dane są pobierane z normalnych populacji o tej samej wariancji, prawie wszystkie informacje o przesunięciu lokalizacji są wzorami szeregów. Rzeczywiste wartości danych (zależne od ich rang) dodają do tego bardzo niewiele dodatkowych informacji. Jeśli pójdziesz cięższym ogonem niż normalnie, niedługo test Wilcoxona-Manna-Whitneya będzie miał lepszą moc, a także utrzyma nominalny poziom istotności, dzięki czemu „dodatkowe” informacje powyżej szeregów ostatecznie staną się nie tylko nieinformacyjne, ale w niektórych przypadkach sens, wprowadzający w błąd. Jednak prawie symetryczna gruboziarnistość jest rzadką sytuacją; w praktyce często widać skośność.]

Podstawowe idee są dość podobne, wartości p mają tę samą interpretację (prawdopodobieństwo wyniku jako lub bardziej ekstremalne, jeśli hipoteza zerowa była prawdziwa) - aż do interpretacji przesunięcia lokalizacji, jeśli popełnisz wymagane założenia (patrz omówienie hipotez pod koniec tego postu).

Gdybym wykonał tę samą symulację, co na powyższych wykresach dla testu t, wykresy wyglądałyby bardzo podobnie - skala na osiach X i Y wyglądałaby inaczej, ale podstawowy wygląd byłby podobny.

Czy chcemy, aby wartość p była niższa niż 0,05?

Nie powinieneś niczego „chcieć”. Chodzi o to, aby dowiedzieć się, czy próbki różnią się bardziej (w sensie lokalizacji), niż można to wytłumaczyć przypadkiem, aby nie „życzyć” określonego wyniku.

Jeśli powiem: „Czy pójdziesz zobaczyć, co jest samochód color Raja proszę?”, Jeśli chcę bezstronnej oceny tego nie chce Ci się iść „Człowieku, ja naprawdę nadzieję, że to niebieski! To po prostu musi być niebieski". Najlepiej po prostu zobaczyć, jaka jest sytuacja, niż wtrącać się w „Potrzebuję, żeby coś było”.

Jeśli wybrany poziom istotności wynosi 0,05, to odrzucasz hipotezę zerową, gdy wartość p jest mniejsza niż 0,05. Ale brak odrzucenia, gdy masz wystarczająco dużą próbkę, aby prawie zawsze wykryć odpowiednie wielkości efektów, jest co najmniej tak samo interesujące, ponieważ mówi, że wszelkie istniejące różnice są niewielkie.

Co oznacza liczba „mann whitley”?

Statystyka Manna-Whitneya .

Jest to naprawdę znaczące tylko w porównaniu z rozkładem wartości, które może przyjąć, gdy hipoteza zerowa jest prawdziwa (patrz powyższy diagram), i zależy to od tego, z której z kilku konkretnych definicji może skorzystać dany program.

Czy ma to jakiś sens?

Zwykle nie zależy ci na dokładnej wartości jako takiej, ale gdzie leży ona w rozkładzie zerowym (niezależnie od tego, czy jest to mniej więcej typowa wartość, którą powinieneś zobaczyć, gdy hipoteza zerowa jest prawdziwa, czy też bardziej ekstremalna)

P(X<Y)

Czy te dane tutaj po prostu weryfikują, czy nie weryfikują, czy dane źródło, które mam, powinno być używane?

Ten test nie mówi nic o „określonym źródle danych, które mam lub powinienem wykorzystać”.

Zobacz moją dyskusję na temat dwóch sposobów patrzenia na hipotezy WMW poniżej.

Mam spore doświadczenie z regresją i podstawami, ale jestem bardzo ciekawy tego „specjalnego” nieparametrycznego materiału

Nie ma nic szczególnego w testach nieparametrycznych (powiedziałbym, że testy „standardowe” są pod wieloma względami jeszcze bardziej podstawowe niż typowe testy parametryczne) - o ile faktycznie rozumiesz testowanie hipotez.

To chyba temat na inne pytanie.


Istnieją dwa główne sposoby spojrzenia na test hipotezy Wilcoxona-Manna-Whitneya.

i) Jednym z nich jest powiedzenie: „Jestem zainteresowany przesunięciem lokalizacji - to znaczy, że zgodnie z hipotezą zerową obie populacje mają ten sam (ciągły) rozkład , w przeciwieństwie do alternatywy, że jedna jest„ przesunięta ”w górę lub w dół w stosunku do inny"

Wilcoxon-Mann-Whitney działa bardzo dobrze, jeśli przyjmiesz takie założenie (że twoją alternatywą jest tylko zmiana lokalizacji)

W tym przypadku Wilcoxon-Mann-Whitney faktycznie jest testem na mediany ... ale równie dobrze jest testem na środki, a nawet każdą inną statystycznie równoważną lokalizację (na przykład 90 percentyle lub średnie przycięte lub dowolną liczbę inne rzeczy), ponieważ na wszystkie z nich wpływa ten sam sposób zmiany lokalizacji.

Zaletą tego jest to, że jest bardzo łatwo interpretowalny - i łatwo jest wygenerować przedział ufności dla tego przesunięcia lokalizacji.

zmiana lokalizacji

Jednak test Wilcoxona-Manna-Whitneya jest wrażliwy na inne rodzaje różnic niż zmiana lokalizacji.

1212

przesunięcie w P (X <Y) z 1/2


Narysowałem przybliżony rozkład zerowy (ten na czerwono na nowym najwyższym wykresie) tak, jakby był ciągły ... ale rzeczywisty rozkład jest dyskretny. Obraz jest w ten sposób mniej zaśmiecony.
Glen_b

3
+1 Świetna odpowiedź. Jedno z najlepszych i najbardziej dostępnych wyjaśnień testu Wilcoxona-Manna-Whitneya, jaki znam. Dziękuję Ci.
COOLSerdash,

„W tym przypadku Wilcoxon-Mann-Whitney faktycznie jest testem na mediany ... ale równie dobrze jest testem na środki” Jednak niektóre rozkłady nie mają środków, podczas gdy ich mediana jest dobrze zdefiniowana (np. Cauchy).
caracal

@ caracal Chociaż jest to prawda (wielokrotnie powtarzałem tutaj), jeśli ktoś testuje równość populacji, to przypuszczalnie już zakłada, że ​​średnia populacji jest skończona. Jeśli nie, mają problem na długo, zanim przejdą do wyboru testu. Biorąc pod uwagę, że istnieje hipoteza o równej (a tym samym skończonej) liczbie ludności, przy tych samych założeniach, które są zwykle stosowane w celu uczynienia z niej testu median (alternatywnych zmian), WMW jest również testem środków.
Glen_b

17

Załóżmy, że ty i ja trenujemy zespoły torowe. Nasi sportowcy pochodzą z tej samej szkoły, są w podobnym wieku i mają tę samą płeć (tj. Pochodzą z tej samej populacji), ale twierdzę, że odkryłem rewolucyjny nowy system treningowy, który sprawi, że członkowie mojego zespołu będą biegać znacznie szybciej niż Twój. Jak mogę cię przekonać, że to naprawdę działa?

Mamy wyścig.

Następnie siadam i obliczam średni czas dla członków mojego zespołu i średni czas dla twoich członków. Odniosę zwycięstwo, jeśli średni czas dla moich sportowców jest nie tylko szybszy niż średni dla twojego, ale różnica jest również duża w porównaniu do „rozproszenia” lub standardowego odchylenia naszych wyników.


t testem , ponieważ porównujemy te parametry.


„Ale Matt”, narzekasz, „to nie jest do końca uczciwe. Nasze drużyny są bardzo podobne, ale ty - z powodu czystej szansy - skończyłeś najszybszym biegaczem w dzielnicy. Nie jest w tej samej lidze, co wszyscy poza tym jest praktycznie dziwakiem natury. Ukończył 3 minuty przed następnym najszybszym finiszerem, co znacznie skraca średni czas, ale reszta konkurentów jest dość równomierna. Spójrzmy zamiast tego na kolejność ukończenia. Jeśli twoja metoda naprawdę działa, wcześniejsi finaliści powinni w większości pochodzić z twojego zespołu, ale jeśli nie, kolejność finałów powinna być dość losowa. To nie nadaje nadmiernej wagi twojej supergwiazdce! ”


t testu , nie zakładamy, że dane pochodzą z określonych dystrybucji, ani nie obliczamy dla nich żadnych parametrów. Zamiast tego porównujemy bezpośrednio względne szeregi punktów danych.

p

ttt


Właściwie odpowiedziałeś na moje pytanie dokładnie tak, a dokładnie tak, jak chciałem, aby na nie udzielono odpowiedzi. Glen również bardziej szedł po stronie matematycznej, a połączenie tych dwóch odpowiedzi sprawiło, że kliknąłem. Nie mogę jednak odebrać mu nagrody - to znaczy ... rysuje wykresy, pomimo jasności twojej odpowiedzi. Mam wrażenie, że miałeś kiedyś jakąś pracę nauczyciela. Wiem, że w odpowiedziach mogą być pewne uogólnienia, ale wiedziałem, że nie musiałem kupować książki i studiować jej intensywnie, aby zacząć praktycznie stosować nieparametryczne na pewnym poziomie
Taal

t

Ironią tego wszystkiego jest to, że prawdopodobnie nie zamierzam go używać, po prostu przeszkadzało mi, że nie mogłem uzyskać prostej odpowiedzi na to, co to było. Odpowiedź Glen jest o wiele większa niż się spodziewałem i otrzymałem pierwotnie - najlepsze odpowiedzi, których nie potrafię opisać, ponieważ żaden opis okazałby się nieodpowiedni. Jak powiedzieć komuś, jak wygląda kolor niebieski. Jeśli czytasz coś z Whubera, brzmi to tak, jakbyś miał podobny smak ...
Taal


6

Poprosiłeś o poprawienie, jeśli jest źle. Oto kilka komentarzy pod tym nagłówkiem, aby uzupełnić pozytywne sugestie @Peter Flom.

  • „parametr nieparametryczny opiera się na środkowej zamiast średniej”: często w praktyce, ale nie jest to definicja. Kilka testów nieparametrycznych (np. Chi-kwadrat) nie ma nic wspólnego z medianami.

  • opiera się na stopniach swobody zamiast standardowego odchylenia; to bardzo zmieszane. Idea stopni swobody nie jest w żadnym sensie alternatywą dla odchylenia standardowego; stopnie swobody jako idea stosuje się do statystyk.

  • „szczególne źródło danych, które mam, powinno lub nie powinno być wykorzystane”: to pytanie nie ma nic wspólnego z zastosowanym testem istotności, który dotyczy tylko różnicy między podzbiorami danych i jest wyrażony w kategoriach różnicy między medianami.


Wierzę, że twoje podejście do mnie z prośbą o „poprawienie tam, gdzie źle” było jak dotąd najlepszą odpowiedzią. Przypuszczam, że potrzebowałem obalić kilka hipotez zerowych lub nauczyć się przez proces eliminacji. Twoja odpowiedź dała mi nowe informacje, które rozumiem - wciąż mam duże dziury w zrozumieniu tematu, ale nie mogę oczekiwać perfekcji. Być może te dziury są większe niż początkowo się spodziewałem, pisząc to pytanie, a wymiana stosu nie byłaby wystarczająca, bez względu na to, jak „gadatliwy” zadałem pytanie.
Taal

4

„Chcesz” tych samych rzeczy z wartości p, które chcesz w każdym innym teście.

Statystyka U jest wynikiem obliczeń, podobnie jak statystyka t, iloraz szans, statystyka F lub co masz. Formułę można znaleźć w wielu miejscach. Nie jest to zbyt intuicyjne, ale nie ma też innych statystyk testowych, dopóki się do nich nie przyzwyczaisz (uznajemy, że 2 jest w znacznym zakresie, ponieważ cały czas je widzimy).

Reszta wyniku w tekście bloku powinna być wyraźna.

Aby uzyskać bardziej ogólne wprowadzenie do testów nieparametrycznych, odpowiadam: @NickCox .... dostaję dobrą książkę. Nieparametryczny oznacza po prostu „bez parametrów”; istnieje wiele nieparametrycznych testów i statystyk dla różnych celów.


Tak, idealnie, dobra książka pomogłaby; jednak wydaje się to niepotrzebne w przypadku dzisiejszych zasobów (takich jak stackexchange), wikipedii (czasami), konkurencji na rynku YouTube (czy wiesz, że za każdy milion wyświetleń ktoś dostaje 4000 $?), a także wiele innych zasobów. Zasadniczo, podobnie jak mój styl uczenia się, bardzo nie udaje mi się również proste uczenie książek.
Taal

1
Doceniam twój post, ale tak naprawdę już przypomina większość tego, co już wiem lub niestety założyłem. Wydaje się, że istnieje pewien wzorzec, w którym prawie każde wyjaśnienie, które otrzymuję, zatrzymuje się w tym konkretnym punkcie. Być może w tym momencie staje się on zbyt skomplikowany, aby go wytłumaczyć lub zbyt duży wysiłek - nie jestem pewien. Tak czy inaczej, jest to wzorzec, którego doświadczam z każdego źródła informacji, którego zwykle używam - co ironicznie powtórzyłoby oświadczenie każdego z nas. Być może nie zdawałem sobie sprawy, że odpowiedź była tak złożona; potem znowu widziałem intensywną odpowiedź na SE.
Taal

2
Najpierw poprosisz nas o uproszczenie, a następnie narzekasz, że nasze odpowiedzi są proste! Jeśli chcesz zrozumieć formułę dla U (lub cokolwiek innego), spójrz na nią. Jeśli chcesz czegoś prostego, nie proś o złożoność! Wpis w Wikipedii to doskonały, szczegółowy wpis ze wszystkimi szczegółami. Nie rozumiesz tego Więc. Co chcesz?
Peter Flom - Przywróć Monikę

1
Przypuszczam, że gdzieś pomiędzy. Przyznaję, że nie jestem najlepszy w komunikowaniu się i rozumiem, że jesteś frustracją, heh. To moja cecha, o której właściwie wiem. Szczerze mówiąc, myślę, że będę musiał pomyśleć o tym, czego naprawdę chcę - ponieważ prawie tak, jak staram się przesuwać pytanie wystarczająco, aby pokrywało się z obszarem, o którym nie wiedziałem lub wcześniej nie wiedziałem o. Trudno zapytać o coś, czego ogólnie nie rozumiesz. Przypuszczam, że po prostu wrócę do tego.
Taal

1

W odpowiedzi na niedawno zamknięte pytanie dotyczy to również powyższego. Poniżej cytat z klasycznych testów statystycznych Bradleya bez dystrybucji (1968, s. 15–16), które, jak sądzę, są dość długie, ale dość jasne wyjaśnienie.

Terminy nieparametryczne i bez rozkładu nie są synonimami, a żaden z nich nie zapewnia w pełni zadowalającego opisu klasy statystyk, do których mają się odnosić. Z grubsza mówiąc, test nieparametryczny to taki, który nie wysuwa żadnej hipotezy o wartości parametru w statystycznej funkcji gęstości, podczas gdy test bez dystrybucji to taki, który nie przyjmuje żadnych założeń dotyczących dokładnej postaci populacji próby. Definicje nie wykluczają się wzajemnie, a test może być zarówno wolny od dystrybucji, jak i parametryczny ... Aby całkowicie wyjaśnić, co należy rozumieć przez brak dystrybucji, konieczne jest rozróżnienie między trzema dystrybucjami: populacja objęta próbą; (b) cechy obserwacyjnej faktycznie wykorzystanej w badaniu; oraz (c) statystyki testowej. Rozkład, z którego testy są „bezpłatne”, jest zgodny z (a) populacji objętej próbą. A swoboda, którą cieszą, jest zwykle względna ... Jednak założenia nigdy nie są tak skomplikowane, aby sugerować populację, której rozkład jest całkowicie określony. Powód ... jest bardzo prosty: wielkości nie stosuje się jako takich w teście [nieparametrycznym], nie ma też żadnego innego silnie powiązanego atrybutu populacji tego wariantu. Zamiast nie ma też żadnego innego silnie powiązanego atrybutu populacji tego wariantu. Zamiast nie ma też żadnego innego silnie powiązanego atrybutu populacji tego wariantu. ZamiastPróbkę -związanego charachteristics rodzaje otrzymanych obserwacji ... zapewnić informatikon używany przez statystykę testową. ... W ten sposób, gdy oba testy nieparametryczne parametryczne i wymagają że Postać F jest rozkład związany z uwagi być w pełni znane, to wiadomo, w przypadku parametrycznej, nie jest generalnie zbliżającym się ogłoszeniem, należy zatem „założyć” lub wywnioskować wymagany rozkład wielkości na podstawie przybliżonych lub niepełnych informacji. W przypadku nieparametrycznym, z drugiej strony, rozproszenie cechy obserwacjijest zwykle znany z a priori i dlatego nie musi być „zakładany”. Różnica nie polega zatem na wymaganiu, lecz na wymaganiach i na pewności, że wymóg zostanie spełniony.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.