Statystyki i duże zbiory danych binomial

4

Jak ocenić dopasowanie dwumianowego GLMM wyposażonego w lme4 (> 1.0)?

Mam GLMM z rozkładem dwumianowym i funkcją linku logit i mam wrażenie, że ważny aspekt danych nie jest dobrze reprezentowany w modelu. Aby to sprawdzić, chciałbym wiedzieć, czy dane są dobrze opisane przez funkcję liniową w skali logit. Dlatego chciałbym wiedzieć, czy reszty są dobrze wychowane. Nie mogę jednak dowiedzieć …

19 binomial residuals glmm lme4-nlme

3

W jaki sposób regresja logistyczna wykorzystuje rozkład dwumianowy?

Próbuję zrozumieć, w jaki sposób regresja logistyczna wykorzystuje rozkład dwumianowy. Powiedzmy, że badam sukces gniazda u ptaków. Prawdopodobieństwo sukcesu gniazda wynosi 0,6. Korzystając z rozkładu dwumianowego, mogę obliczyć prawdopodobieństwo sukcesów na podstawie n prób (liczby badanych gniazd). Ale w jaki sposób stosuje się rozkład dwumianowy w kontekście modelowania? Powiedzmy, że …

19 logistic binomial

4

Wykorzystanie przesunięcia w modelu dwumianowym w celu uwzględnienia zwiększonej liczby pacjentów

Dwa powiązane ze mną pytania. Mam ramkę danych, która zawiera liczbę pacjentów w jednej kolumnie (zakres od 10 do 17 pacjentów) oraz 0 i 1 zera pokazujące, czy zdarzenie miało miejsce tego dnia. Używam modelu dwumianowego do regresji prawdopodobieństwa incydentu na liczbę pacjentów. Chciałbym jednak dostosować się do faktu, że …

18 binomial generalized-linear-model offset

3

Jak mogę modelować flipy, dopóki N nie odniesie sukcesu?

Ty i ja decydujemy się zagrać w grę, w której na zmianę podrzucamy monetę. Pierwszy gracz, który rzuci łącznie 10 głów, wygrywa. Oczywiście istnieje spór o to, kto powinien iść pierwszy. Symulacje tej gry pokazują, że gracz, który przerzuca pierwszy, wygrywa o 6% więcej niż gracz, który przerzuca drugi (pierwszy …

17 probability python binomial negative-binomial

1

Nierównomierny rozkład wartości p podczas symulacji testów dwumianowych w ramach hipotezy zerowej

Słyszałem, że zgodnie z hipotezą zerową rozkład wartości p powinien być jednolity. Jednak symulacje testu dwumianowego w MATLAB zwracają bardzo różne od jednolitych rozkłady ze średnią większą niż 0,5 (w tym przypadku 0,518): coin = [0 1]; success_vec = nan(20000,1); for i = 1:20000 success = 0; for j = …

17 matlab p-value binomial simulation uniform

2

Bayesowskie oszacowanie

To pytanie jest techniczną kontynuacją tego pytania . Mam problem ze zrozumieniem i replikacją modelu przedstawionego w Raftery (1988): Wnioskowanie o dwumianowym parametrze : hierarchiczne podejście BayesaNN.N w WinBUGS / OpenBUGS / JAGS. Nie chodzi tylko o kod, więc powinien być tutaj na temat. tło Niech będzie zbiorem liczb sukcesów …

16 bayesian binomial hierarchical-bayesian winbugs

4

Dokładność maszyny zwiększającej gradient zmniejsza się wraz ze wzrostem liczby iteracji

Eksperymentuję z algorytmem maszyny do zwiększania gradientu za pośrednictwem caretpakietu w R. Korzystając z małego zestawu danych o przyjęciach na studia, uruchomiłem następujący kod: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine …

15 machine-learning caret boosting gbm hypothesis-testing t-test panel-data psychometrics intraclass-correlation generalized-linear-model categorical-data binomial model intercept causality cross-correlation distributions ranks p-value z-test sign-test time-series references terminology cross-correlation definition probability distributions beta-distribution inverse-gamma missing-data paired-comparisons paired-data clustered-standard-errors cluster-sample time-series arima logistic binary-data odds-ratio medicine hypothesis-testing wilcoxon-mann-whitney unsupervised-learning hierarchical-clustering neural-networks train clustering k-means regression ordinal-data change-scores machine-learning experiment-design roc precision-recall auc stata multilevel-analysis regression fitting nonlinear jmp r data-visualization gam gamm4 r lme4-nlme many-categories regression causality instrumental-variables endogeneity controlling-for-a-variable

1

Jaka intuicja kryje się za wymiennymi próbkami pod hipotezą zerową?

Testy permutacyjne (zwane również testem randomizacji, testem ponownej randomizacji lub testem dokładnym) są bardzo przydatne i przydają się, gdy t-testnie jest spełnione założenie o rozkładzie normalnym wymagane na przykład i gdy transformacja wartości przez ranking test nieparametryczny, Mann-Whitney-U-testktóry prowadziłby do utraty większej ilości informacji. Jednak nie należy zapominać o jednym …

15 hypothesis-testing permutation-test exchangeability r statistical-significance loess data-visualization normal-distribution pdf ggplot2 kernel-smoothing probability self-study expected-value normal-distribution prior correlation time-series regression heteroscedasticity estimation estimators fisher-information data-visualization repeated-measures binary-data panel-data mathematical-statistics coefficient-of-variation normal-distribution order-statistics regression machine-learning one-class probability estimators forecasting prediction validation finance measurement-error variance mean spatial monte-carlo data-visualization boxplot sampling uniform chi-squared goodness-of-fit probability mixture theory gaussian-mixture regression statistical-significance p-value bootstrap regression multicollinearity correlation r poisson-distribution survival regression categorical-data ordinal-data ordered-logit regression interaction time-series machine-learning forecasting cross-validation binomial multiple-comparisons simulation false-discovery-rate r clustering frequency wilcoxon-mann-whitney wilcoxon-signed-rank r svm t-test missing-data excel r numerical-integration r random-variable lme4-nlme mixed-model weighted-regression power-law errors-in-variables machine-learning classification entropy information-theory mutual-information

4

Jak sprawdzić, czy strona pokerowa online jest uczciwa?

W zeszłym tygodniu odbyłem interesującą dyskusję z moim dobrym przyjacielem. Grał w pokera online i zasugerował, że istnieje związek między nową subskrypcją / dodatkowym transferem pieniędzy a kartami, które otrzymujesz, tj. Masz dobre karty, które można uzależnić. Witryny prawdopodobnie byłyby bardzo ryzykowne, gdyby to była prawda, ale problem wciąż mnie …

15 binomial games wilcoxon-signed-rank

7

Intuicyjnie rozumiem, dlaczego rozkład Poissona jest ograniczającym przypadkiem rozkładu dwumianowego

W „Analizie danych” DS Sivii istnieje pochodna rozkładu Poissona z rozkładu dwumianowego. Twierdzą, że rozkład Poissona jest ograniczającym przypadkiem rozkładu dwumianowego, gdy M→∞M→∞M\rightarrow\infty , gdzie MMM jest liczbą prób. Pytanie 1: Jak intuicyjnie zrozumieć ten argument? Pytanie 2: Dlaczego dużymi MMM limit M!N!(M−N)!M!N!(M−N)!\frac{M!}{N!(M-N)!}równaMNN!MNN!\frac{M^{N}}{N!}, gdzieNNNjest liczbą sukcesów wpróbachMMM? (Ten krok jest …

14 binomial poisson-distribution combinatorics intuition probability-calculus

1

Interwał przewidywania dla losowej zmiennej dwumianowej

Jaka jest formuła (przybliżona lub dokładna) przedziału predykcji dla losowej zmiennej dwumianowej? Załóżmy, że , i obserwujemy y (na podstawie Y ). N jest znana.Y∼ B i n o m ( n , p )Y∼Binom(n,p)Y \sim \mathsf{Binom}(n, p)yyyYYYnnn Naszym celem jest uzyskanie 95% przedział predykcji dla nowego czerpać z .YYY …

14 confidence-interval binomial prediction-interval

2

R: funkcja glm z rodziną = specyfikacja „dwumianowa” i „waga”

Jestem bardzo zdezorientowany, jak waga działa w glm z rodziną = „dwumianowy”. W moim rozumieniu prawdopodobieństwo glm z rodziną = „dwumianowy” jest określone w następujący sposób: f(y)=(nny)pny(1−p)n(1−y)=exp(n[ylogp1−p−(−log(1−p))]+log(nny))f(y)=(nny)pny(1−p)n(1−y)=exp⁡(n[ylog⁡p1−p−(−log⁡(1−p))]+log⁡(nny)) f(y) = {n\choose{ny}} p^{ny} (1-p)^{n(1-y)} = \exp \left(n \left[ y \log \frac{p}{1-p} - \left(-\log (1-p)\right) \right] + \log {n \choose ny}\right) gdzie yyy …

14 r logistic generalized-linear-model binomial weighted-regression

2

Nadmierna dyspersja w regresji logistycznej

Próbuję zrozumieć koncepcję nadmiernej dyspersji w regresji logistycznej. Czytałem, że nadmierna dyspersja występuje wtedy, gdy zaobserwowana wariancja zmiennej odpowiedzi jest większa niż można by oczekiwać po rozkładzie dwumianowym. Ale jeśli zmienna dwumianowa może mieć tylko dwie wartości (1/0), to jak może mieć średnią i wariancję? Nie przeszkadza mi obliczanie średniej …

14 logistic variance binomial mean overdispersion

2

Nie rozumiem wariancji dwumianu

Czuję się naprawdę głupio, nawet zadając tak podstawowe pytanie, ale oto: Jeśli mam losową zmienną która może przyjmować wartości i , przy czym oraz , to jeśli wyciągnę z niej próbek, otrzymam rozkład dwumianowy.0 1 P ( X = 1 ) = p P ( X = 0 ) = …

13 variance binomial

5

Prawdopodobieństwo serii k sukcesów w sekwencji n prób Bernoulliego

Próbuję znaleźć prawdopodobieństwo prawidłowego wykonania 8 prób z rzędu w bloku 25 prób, masz 8 wszystkich bloków (z 25 prób), aby uzyskać 8 prób z rzędu. Prawdopodobieństwo, że jakakolwiek próba będzie poprawna w oparciu o zgadywanie, wynosi 1/3, po uzyskaniu poprawności 8 z rzędu bloki się zakończą (więc uzyskanie więcej …

13 probability binomial

Pytania otagowane jako binomial