W częstym testowaniu hipotez p-wartość jest prawdopodobieństwem wyniku jako ekstremum (lub większym) niż wynik obserwowany, przy założeniu, że hipoteza zerowa jest prawdziwa.
Dlaczego wartości p i statystyki testu ks zmniejszają się wraz ze wzrostem wielkości próby? Weź ten kod Python jako przykład: import numpy as np from scipy.stats import norm, ks_2samp np.random.seed(0) for n in [10, 100, 1000, 10000, 100000, 1000000]: x = norm(0, 4).rvs(n) y = norm(0, 4.1).rvs(n) print ks_2samp(x, y) …
Próbuję zrozumieć czynnik Bayesa (BF). Uważam, że są one jak stosunek prawdopodobieństwa 2 hipotez. Jeśli więc BF wynosi 5, oznacza to, że H1 jest 5 razy bardziej prawdopodobne niż H0. A wartość 3-10 wskazuje na umiarkowane dowody, podczas gdy> 10 wskazuje na mocne dowody. Jednak w przypadku wartości P tradycyjnie …
Testowanie hipotez jest podobne do problemu klasyfikacji. Powiedzmy, że mamy 2 możliwe etykiety dla obserwacji (tematu) - winny kontra niewinny. Niech Niewinny będzie hipotezą zerową. Gdybyśmy spojrzeli na problem z punktu widzenia klasyfikacji, wyszkolilibyśmy klasyfikatora, który przewidziałby prawdopodobieństwo przynależności podmiotu do każdej z 2 klas, biorąc pod uwagę dane. Następnie …
Czytam książkę Larry'ego Wassermana, All of Statistics , a obecnie o wartościach p (strona 187). Pozwól mi najpierw wprowadzić kilka definicji (cytuję): Definicja 1 Funkcja mocy testu z obszarem odrzucenia jest zdefiniowana przez Rozmiar testu jest określony na Mówi się, że test ma poziom \ alpha, jeśli jego rozmiar jest …
Kontekst Jest to nieco podobne do tego pytania , ale nie sądzę, że jest to dokładna kopia. Kiedy szukasz instrukcji, jak wykonać test hipotezy ładowania początkowego, zwykle stwierdza się, że dobrze jest użyć rozkładu empirycznego dla przedziałów ufności, ale że musisz poprawnie załadować ładunek z rozkładu w ramach hipotezy zerowej, …
Gdy czytam książkę Wassermanna Wszystkie statystyki, dostrzegam subtelną subtelność w definicji wartości p, której nie mogę zrozumieć. Nieformalnie Wassermann określa wartość p jako [..] prawdopodobieństwo (poniżej ) zaobserwowania wartości statystyki testowej takiej samej lub bardziej ekstremalnej niż rzeczywista obserwowana.H0H0H_0 Podkreślenie dodane. To samo bardziej formalnie (Twierdzenie 10.12): Załóżmy, że test …
Powszechnie wiadomo, że wybór testu statystycznego na podstawie wyników innego testu statystycznego jest problematyczny, ponieważ wartości p są trudne do interpretacji (np. Wybór testu statystycznego na podstawie wyniku innego (np. Normalności) ) . Jest to jednak nadal standardowa praktyka w wielu aplikacjach i zwykle nie wydaje się, że jest zauważana …
Używając Amelii w R, uzyskałem wiele przypisanych zestawów danych. Następnie wykonałem test z powtarzanymi pomiarami w SPSS. Teraz chcę połączyć wyniki testu. Wiem, że mogę używać reguł Rubina (zaimplementowanych w dowolnym pakiecie wielokrotnej imputacji w R) do łączenia średnich i standardowych błędów, ale jak mam łączyć wartości p? Czy to …
Pochodzę z nauk społecznych, gdzie p <0,05 jest prawie normą, przy czym p <0,1 ip <0,01 również się pojawiają, ale zastanawiałem się: jakie kierunki studiów, jeśli w ogóle, używają niższych wartości p jako wspólnej standard?
W algorytmach motywów sieciowych wydaje się dość powszechne zwracanie zarówno wartości p, jak i wyniku Z dla statystyki: „Sieć wejściowa zawiera X kopii podgrupy G”. Podgraf jest uważany za motyw, jeśli spełnia wartość p <A, Wynik Z> B i X> C, dla niektórych A, B i C. zdefiniowanych przez użytkownika …
Moje pytanie jest raczej semantyczne. Gdy metoda rutynowo wytwarza wysokie wartości p, nazywa się ją konserwatywną. Czy nazwałbyś coś przeciwnego, tj. Metodę o wysokim poziomie błędu typu II liberalną?
Za pomocą bootstrap obliczam wartości p testów istotności, stosując dwie metody: ponowne próbkowanie w ramach hipotezy zerowej i liczenie wyników co najmniej tak ekstremalnych, jak wynik pochodzący z pierwotnych danych ponowne próbkowanie w ramach alternatywnej hipotezy i liczenie wyników co najmniej tak odległych od pierwotnego wyniku, jak wartość odpowiadająca hipotezie …
Mam dwie zmienne jakościowe / nominalne. Każda z nich może przyjąć tylko dwie różne wartości (więc mam w sumie 4 kombinacje). Każda kombinacja wartości zawiera zestaw wartości liczbowych. Mam więc 4 zestawy liczb. Żeby było bardziej konkretnie, powiedzmy, że mam male / femalei young / oldjako zmienne nominalne i mam …
Testuję niezależność w tabeli awaryjności Nie wiem, czy test G czy test chi-kwadrat Pearsona jest lepszy. Rozmiar próbki jest w setkach, ale istnieją pewne niskie liczby komórek. Jak stwierdzono na stronie Wikipedii , przybliżenie rozkładu chi-kwadrat jest lepsze dla testu G niż dla testu chi-kwadrat Pearsona. Ale używam symulacji Monte …
Używam glms w R (uogólnione modele liniowe). Myślałem, że znam wartości - dopóki nie zobaczyłem, że wywołanie podsumowania dla glm nie daje nadrzędnej wartości reprezentatywnej dla modelu jako całości - przynajmniej nie w miejscu, w którym robią to modele liniowe. Zastanawiam się, czy podano to jako wartość dla przechwytywania u …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.