Rozkład dwumianowy podaje częstotliwości „sukcesów” w ustalonej liczbie niezależnych „prób”. Użyj tego znacznika do pytań o dane, które mogą być dystrybuowane dwumianowo lub do pytań dotyczących teorii tego rozkładu.
Mam GLMM z rozkładem dwumianowym i funkcją linku logit i mam wrażenie, że ważny aspekt danych nie jest dobrze reprezentowany w modelu. Aby to sprawdzić, chciałbym wiedzieć, czy dane są dobrze opisane przez funkcję liniową w skali logit. Dlatego chciałbym wiedzieć, czy reszty są dobrze wychowane. Nie mogę jednak dowiedzieć …
Próbuję zrozumieć, w jaki sposób regresja logistyczna wykorzystuje rozkład dwumianowy. Powiedzmy, że badam sukces gniazda u ptaków. Prawdopodobieństwo sukcesu gniazda wynosi 0,6. Korzystając z rozkładu dwumianowego, mogę obliczyć prawdopodobieństwo sukcesów na podstawie n prób (liczby badanych gniazd). Ale w jaki sposób stosuje się rozkład dwumianowy w kontekście modelowania? Powiedzmy, że …
Dwa powiązane ze mną pytania. Mam ramkę danych, która zawiera liczbę pacjentów w jednej kolumnie (zakres od 10 do 17 pacjentów) oraz 0 i 1 zera pokazujące, czy zdarzenie miało miejsce tego dnia. Używam modelu dwumianowego do regresji prawdopodobieństwa incydentu na liczbę pacjentów. Chciałbym jednak dostosować się do faktu, że …
Ty i ja decydujemy się zagrać w grę, w której na zmianę podrzucamy monetę. Pierwszy gracz, który rzuci łącznie 10 głów, wygrywa. Oczywiście istnieje spór o to, kto powinien iść pierwszy. Symulacje tej gry pokazują, że gracz, który przerzuca pierwszy, wygrywa o 6% więcej niż gracz, który przerzuca drugi (pierwszy …
Słyszałem, że zgodnie z hipotezą zerową rozkład wartości p powinien być jednolity. Jednak symulacje testu dwumianowego w MATLAB zwracają bardzo różne od jednolitych rozkłady ze średnią większą niż 0,5 (w tym przypadku 0,518): coin = [0 1]; success_vec = nan(20000,1); for i = 1:20000 success = 0; for j = …
To pytanie jest techniczną kontynuacją tego pytania . Mam problem ze zrozumieniem i replikacją modelu przedstawionego w Raftery (1988): Wnioskowanie o dwumianowym parametrze : hierarchiczne podejście BayesaNN.N w WinBUGS / OpenBUGS / JAGS. Nie chodzi tylko o kod, więc powinien być tutaj na temat. tło Niech będzie zbiorem liczb sukcesów …
Eksperymentuję z algorytmem maszyny do zwiększania gradientu za pośrednictwem caretpakietu w R. Korzystając z małego zestawu danych o przyjęciach na studia, uruchomiłem następujący kod: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine …
Testy permutacyjne (zwane również testem randomizacji, testem ponownej randomizacji lub testem dokładnym) są bardzo przydatne i przydają się, gdy t-testnie jest spełnione założenie o rozkładzie normalnym wymagane na przykład i gdy transformacja wartości przez ranking test nieparametryczny, Mann-Whitney-U-testktóry prowadziłby do utraty większej ilości informacji. Jednak nie należy zapominać o jednym …
W zeszłym tygodniu odbyłem interesującą dyskusję z moim dobrym przyjacielem. Grał w pokera online i zasugerował, że istnieje związek między nową subskrypcją / dodatkowym transferem pieniędzy a kartami, które otrzymujesz, tj. Masz dobre karty, które można uzależnić. Witryny prawdopodobnie byłyby bardzo ryzykowne, gdyby to była prawda, ale problem wciąż mnie …
W „Analizie danych” DS Sivii istnieje pochodna rozkładu Poissona z rozkładu dwumianowego. Twierdzą, że rozkład Poissona jest ograniczającym przypadkiem rozkładu dwumianowego, gdy M→∞M→∞M\rightarrow\infty , gdzie MMM jest liczbą prób. Pytanie 1: Jak intuicyjnie zrozumieć ten argument? Pytanie 2: Dlaczego dużymi MMM limit M!N!(M−N)!M!N!(M−N)!\frac{M!}{N!(M-N)!}równaMNN!MNN!\frac{M^{N}}{N!}, gdzieNNNjest liczbą sukcesów wpróbachMMM? (Ten krok jest …
Jaka jest formuła (przybliżona lub dokładna) przedziału predykcji dla losowej zmiennej dwumianowej? Załóżmy, że , i obserwujemy y (na podstawie Y ). N jest znana.Y∼ B i n o m ( n , p )Y∼Binom(n,p)Y \sim \mathsf{Binom}(n, p)yyyYYYnnn Naszym celem jest uzyskanie 95% przedział predykcji dla nowego czerpać z .YYY …
Jestem bardzo zdezorientowany, jak waga działa w glm z rodziną = „dwumianowy”. W moim rozumieniu prawdopodobieństwo glm z rodziną = „dwumianowy” jest określone w następujący sposób: f(y)=(nny)pny(1−p)n(1−y)=exp(n[ylogp1−p−(−log(1−p))]+log(nny))f(y)=(nny)pny(1−p)n(1−y)=exp(n[ylogp1−p−(−log(1−p))]+log(nny)) f(y) = {n\choose{ny}} p^{ny} (1-p)^{n(1-y)} = \exp \left(n \left[ y \log \frac{p}{1-p} - \left(-\log (1-p)\right) \right] + \log {n \choose ny}\right) gdzie yyy …
Próbuję zrozumieć koncepcję nadmiernej dyspersji w regresji logistycznej. Czytałem, że nadmierna dyspersja występuje wtedy, gdy zaobserwowana wariancja zmiennej odpowiedzi jest większa niż można by oczekiwać po rozkładzie dwumianowym. Ale jeśli zmienna dwumianowa może mieć tylko dwie wartości (1/0), to jak może mieć średnią i wariancję? Nie przeszkadza mi obliczanie średniej …
Czuję się naprawdę głupio, nawet zadając tak podstawowe pytanie, ale oto: Jeśli mam losową zmienną która może przyjmować wartości i , przy czym oraz , to jeśli wyciągnę z niej próbek, otrzymam rozkład dwumianowy.0 1 P ( X = 1 ) = p P ( X = 0 ) = …
Próbuję znaleźć prawdopodobieństwo prawidłowego wykonania 8 prób z rzędu w bloku 25 prób, masz 8 wszystkich bloków (z 25 prób), aby uzyskać 8 prób z rzędu. Prawdopodobieństwo, że jakakolwiek próba będzie poprawna w oparciu o zgadywanie, wynosi 1/3, po uzyskaniu poprawności 8 z rzędu bloki się zakończą (więc uzyskanie więcej …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.