Statystyki i duże zbiory danych p-value

2

Test Kołmogorowa – Smirnowa: wartość p i statystyki testu ks zmniejszają się wraz ze wzrostem wielkości próby

Dlaczego wartości p i statystyki testu ks zmniejszają się wraz ze wzrostem wielkości próby? Weź ten kod Python jako przykład: import numpy as np from scipy.stats import norm, ks_2samp np.random.seed(0) for n in [10, 100, 1000, 10000, 100000, 1000000]: x = norm(0, 4).rvs(n) y = norm(0, 4.1).rvs(n) print ks_2samp(x, y) …

12 python p-value goodness-of-fit intuition scipy

3

Dlaczego wartości graniczne stosowane dla czynników Bayesa i wartości p są tak różne?

Próbuję zrozumieć czynnik Bayesa (BF). Uważam, że są one jak stosunek prawdopodobieństwa 2 hipotez. Jeśli więc BF wynosi 5, oznacza to, że H1 jest 5 razy bardziej prawdopodobne niż H0. A wartość 3-10 wskazuje na umiarkowane dowody, podczas gdy> 10 wskazuje na mocne dowody. Jednak w przypadku wartości P tradycyjnie …

11 hypothesis-testing bayesian p-value bayes-factors

5

Dlaczego odrzucamy hipotezę zerową na poziomie 0,05, a nie na poziomie 0,5 (jak to robimy w klasyfikacji)

Testowanie hipotez jest podobne do problemu klasyfikacji. Powiedzmy, że mamy 2 możliwe etykiety dla obserwacji (tematu) - winny kontra niewinny. Niech Niewinny będzie hipotezą zerową. Gdybyśmy spojrzeli na problem z punktu widzenia klasyfikacji, wyszkolilibyśmy klasyfikatora, który przewidziałby prawdopodobieństwo przynależności podmiotu do każdej z 2 klas, biorąc pod uwagę dane. Następnie …

11 probability hypothesis-testing classification p-value

2

Dwie definicje wartości p: jak udowodnić ich równoważność?

Czytam książkę Larry'ego Wassermana, All of Statistics , a obecnie o wartościach p (strona 187). Pozwól mi najpierw wprowadzić kilka definicji (cytuję): Definicja 1 Funkcja mocy testu z obszarem odrzucenia jest zdefiniowana przez Rozmiar testu jest określony na Mówi się, że test ma poziom \ alpha, jeśli jego rozmiar jest …

11 hypothesis-testing mathematical-statistics p-value

1

Nieparametryczne wartości p ładowania początkowego a przedziały ufności

Kontekst Jest to nieco podobne do tego pytania , ale nie sądzę, że jest to dokładna kopia. Kiedy szukasz instrukcji, jak wykonać test hipotezy ładowania początkowego, zwykle stwierdza się, że dobrze jest użyć rozkładu empirycznego dla przedziałów ufności, ale że musisz poprawnie załadować ładunek z rozkładu w ramach hipotezy zerowej, …

11 confidence-interval p-value bootstrap

2

Subtelność wartości p: większa-równa vs. większa

Gdy czytam książkę Wassermanna Wszystkie statystyki, dostrzegam subtelną subtelność w definicji wartości p, której nie mogę zrozumieć. Nieformalnie Wassermann określa wartość p jako [..] prawdopodobieństwo (poniżej ) zaobserwowania wartości statystyki testowej takiej samej lub bardziej ekstremalnej niż rzeczywista obserwowana.H0H0H_0 Podkreślenie dodane. To samo bardziej formalnie (Twierdzenie 10.12): Załóżmy, że test …

11 hypothesis-testing chi-squared p-value

1

Artykuł na temat przeprowadzania testów hipotez opartych na wynikach innego testu

Powszechnie wiadomo, że wybór testu statystycznego na podstawie wyników innego testu statystycznego jest problematyczny, ponieważ wartości p są trudne do interpretacji (np. Wybór testu statystycznego na podstawie wyniku innego (np. Normalności) ) . Jest to jednak nadal standardowa praktyka w wielu aplikacjach i zwykle nie wydaje się, że jest zauważana …

11 hypothesis-testing references p-value

2

Jak uzyskać połączone wartości p na testach przeprowadzonych w wielu przypisanych zestawach danych?

Używając Amelii w R, uzyskałem wiele przypisanych zestawów danych. Następnie wykonałem test z powtarzanymi pomiarami w SPSS. Teraz chcę połączyć wyniki testu. Wiem, że mogę używać reguł Rubina (zaimplementowanych w dowolnym pakiecie wielokrotnej imputacji w R) do łączenia średnich i standardowych błędów, ale jak mam łączyć wartości p? Czy to …

11 r spss p-value multiple-imputation pooling

4

Przykłady badań z wykorzystaniem p <0,001, p <0,0001 lub nawet niższych wartości p?

Pochodzę z nauk społecznych, gdzie p <0,05 jest prawie normą, przy czym p <0,1 ip <0,01 również się pojawiają, ale zastanawiałem się: jakie kierunki studiów, jeśli w ogóle, używają niższych wartości p jako wspólnej standard?

11 statistical-significance p-value

3

Jaka jest różnica między wynikami Z a wartościami p?

W algorytmach motywów sieciowych wydaje się dość powszechne zwracanie zarówno wartości p, jak i wyniku Z dla statystyki: „Sieć wejściowa zawiera X kopii podgrupy G”. Podgraf jest uważany za motyw, jeśli spełnia wartość p <A, Wynik Z> B i X> C, dla niektórych A, B i C. zdefiniowanych przez użytkownika …

11 hypothesis-testing p-value z-statistic

2

„Liberalne” wartości p?

Moje pytanie jest raczej semantyczne. Gdy metoda rutynowo wytwarza wysokie wartości p, nazywa się ją konserwatywną. Czy nazwałbyś coś przeciwnego, tj. Metodę o wysokim poziomie błędu typu II liberalną?

11 hypothesis-testing statistical-significance p-value terminology type-i-and-ii-errors

1

Dwie metody testów istotności bootstrap

Za pomocą bootstrap obliczam wartości p testów istotności, stosując dwie metody: ponowne próbkowanie w ramach hipotezy zerowej i liczenie wyników co najmniej tak ekstremalnych, jak wynik pochodzący z pierwotnych danych ponowne próbkowanie w ramach alternatywnej hipotezy i liczenie wyników co najmniej tak odległych od pierwotnego wyniku, jak wartość odpowiadająca hipotezie …

11 statistical-significance bootstrap p-value

5

Jak przetestować efekt interakcji za pomocą testu nieparametrycznego (np. Testu permutacji)?

Mam dwie zmienne jakościowe / nominalne. Każda z nich może przyjąć tylko dwie różne wartości (więc mam w sumie 4 kombinacje). Każda kombinacja wartości zawiera zestaw wartości liczbowych. Mam więc 4 zestawy liczb. Żeby było bardziej konkretnie, powiedzmy, że mam male / femalei young / oldjako zmienne nominalne i mam …

10 hypothesis-testing p-value nonparametric permutation-test

3

Test G vs test chi-kwadrat Pearsona

Testuję niezależność w tabeli awaryjności Nie wiem, czy test G czy test chi-kwadrat Pearsona jest lepszy. Rozmiar próbki jest w setkach, ale istnieją pewne niskie liczby komórek. Jak stwierdzono na stronie Wikipedii , przybliżenie rozkładu chi-kwadrat jest lepsze dla testu G niż dla testu chi-kwadrat Pearsona. Ale używam symulacji Monte …

10 chi-squared p-value monte-carlo contingency-tables

3

glm w R - która wartość reprezentuje dobroć dopasowania całego modelu?

Używam glms w R (uogólnione modele liniowe). Myślałem, że znam wartości - dopóki nie zobaczyłem, że wywołanie podsumowania dla glm nie daje nadrzędnej wartości reprezentatywnej dla modelu jako całości - przynajmniej nie w miejscu, w którym robią to modele liniowe. Zastanawiam się, czy podano to jako wartość dla przechwytywania u …

10 r statistical-significance generalized-linear-model p-value descriptive-statistics

Pytania otagowane jako p-value