W częstym testowaniu hipotez p-wartość jest prawdopodobieństwem wyniku jako ekstremum (lub większym) niż wynik obserwowany, przy założeniu, że hipoteza zerowa jest prawdziwa.
Przeczytałem ten artykuł o sprawie Palantira, w której Departament Pracy oskarża ich o dyskryminację Azjatów. Czy ktoś wie, skąd wziął te oszacowania prawdopodobieństwa? Nie dostaję 1/741 w pozycji (a). (a) Na stanowisko Inżyniera ds. kontroli jakości, z grupy ponad 730 wykwalifikowanych kandydatów - z których około 77% to Azjaci - …
Dzisiaj zapytano mnie, czy wartość p wynosząca 0,05 (dokładnie) jest uważana za znaczącą (biorąc pod uwagę alfa = 5%), czy nie. Nie znałem odpowiedzi i Google podniosło obie odpowiedzi: (a) wynik jest znaczący, jeśli p jest mniejsze niż 5% i (b) jeśli p jest mniejsze niż 5% lub równe 5%. …
Mam pytania dotyczące AIC i mam nadzieję, że możesz mi pomóc. Zastosowałem wybór modelu (do tyłu lub do przodu) na podstawie AIC na moich danych. Niektóre wybrane zmienne zakończyły się wartościami p> 0,05. Wiem, że ludzie mówią, że powinniśmy wybierać modele oparte na AIC zamiast wartości p, więc wydaje się, …
Mam nadzieję, że to nie jest głupie pytanie. Powiedzmy, że mam dowolną ciągłą dystrybucję. Mam również statystyki i chciałbym użyć tego dowolnego rozkładu, aby uzyskać wartość p dla tej statystyki. Zdaję sobie sprawę, że w R łatwo to zrobić, o ile twoja dystrybucja pasuje do jednego z wbudowanych, tak jakby …
Rozumiem procedurę i to, co kontroluje. Jaki jest zatem wzór skorygowanej wartości p w procedurze BH dla wielokrotnych porównań? Właśnie teraz zdałem sobie sprawę, że pierwotny BH nie wytworzył skorygowanych wartości p, a jedynie dostosował warunek (nie) odrzucenia: https://www.jstor.org/stable/2346101 . Gordon Smyth wprowadził skorygowane wartości p BH w 2002 r., …
Te dwie funkcje istnieją w R, ale nie znam ich różnic. Wygląda na to, że zwracają tylko te same wartości p podczas wywoływania wilcox.testz correct=FALSEoraz wilcox_test(w pakiecie monet) z distribution="aymptotic". Dla innych wartości zwracają różne wartości p. Również wilcox.testzawsze zwraca W = 0 dla mojego zestawu danych, niezależnie od ustawień …
Pakiety oprogramowania do wykrywania motywów sieciowych mogą zwracać niezwykle wysokie wyniki Z (najwyższy, jaki widziałem, to 600 000+, ale wyniki Z powyżej 100 są dość powszechne). Planuję pokazać, że te wyniki Z są fałszywe. Ogromne wyniki Z odpowiadają bardzo niskim związanym prawdopodobieństwom. Wartości powiązanych prawdopodobieństw podano np. Na stronie wikipedii …
Zdaję sobie sprawę, że ten temat pojawiał się wiele razy wcześniej, np. Tutaj , ale wciąż nie jestem pewien, jak najlepiej zinterpretować moje wyniki regresji. Mam bardzo prosty zestaw danych, składający się z kolumny wartości x i kolumny wartości y , podzielonych na dwie grupy według lokalizacji (loc). Punkty wyglądają …
Słyszałem (przepraszam, nie mogę podać linku do tekstu, coś mi powiedziano), że wysoka dodatnia kurtoza reszt może być problematyczna dla dokładnych testów hipotez i przedziałów ufności (a zatem problemów z wnioskowaniem statystycznym). Czy to prawda, a jeśli tak, to dlaczego? Czy wysoka dodatnia kurtoza reszt nie wskazywałaby, że większość reszt …
Ogólny konsensus w podobnej kwestii: czy błędem jest odnosić się do wyników jako „bardzo znaczących”? jest to, że „wysoce znaczący” jest ważnym, choć niespecyficznym, sposobem opisania siły powiązania, którego wartość p jest znacznie poniżej ustalonego progu istotności. A co z opisywaniem wartości p, które są nieco powyżej twojego progu? Widziałem, …
Próbuję uruchomić Bayesa logit na dane tutaj . Używam bayesglm()w armpakiecie w R. Kodowanie jest dość proste: df = read.csv("http://dl.dropbox.com/u/1791181/bayesglm.csv", header=T) library(arm) model = bayesglm(PASS ~ SEX + HIGH, family=binomial(link="logit"), data=df) summary(model) daje następujący wynik: Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 0.10381 0.10240 1.014 0.311 SEXMale 0.02408 0.09363 …
Stroiłem model przy użyciu caret, ale potem ponownie uruchomiłem model przy użyciu gbmpakietu. Rozumiem, że caretpakiet używa gbmi wynik powinien być taki sam. Jednak tylko szybki test przy użyciu data(iris)wykazuje rozbieżność w modelu około 5% przy użyciu RMSE i R ^ 2 jako metryki oceny. Chcę znaleźć optymalną wydajność modelu …
Trudno mi znaleźć sposób na obliczenie wartości p dla obszaru pod charakterystyką operatora odbiornika (ROC). Mam zmienną ciągłą i wynik testu diagnostycznego. Chcę sprawdzić, czy AUROC jest statystycznie istotny. Znalazłem wiele pakietów zajmujących się krzywymi ROC: pROC, ROCR, caTools, weryfikacja, Epi. Ale nawet po wielu godzinach spędzonych na czytaniu dokumentacji …
Pracuję na wielokrotnej regresji logistycznej w R użyciem glm. Zmienne predykcyjne są ciągłe i kategoryczne. Wyciąg z podsumowania modelu pokazuje, co następuje: Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 2.451e+00 2.439e+00 1.005 0.3150 Age 5.747e-02 3.466e-02 1.658 0.0973 . BMI -7.750e-02 7.090e-02 -1.093 0.2743 ... --- Signif. codes: 0 …
Jak zmienia się względny rozmiar wartości ap przy różnych wielkościach próby? Na przykład, jeśli otrzymałeś przy n = 45 dla korelacji, a następnie przy n = 120 otrzymałeś taką samą wartość p wynoszącą 0,20, jaki byłby względny rozmiar wartości p dla drugiego testu, w porównaniu do oryginalnej wartości p kiedy …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.