Jestem bardzo zdezorientowany, jak waga działa w glm z rodziną = „dwumianowy”. W moim rozumieniu prawdopodobieństwo glm z rodziną = „dwumianowy” jest określone w następujący sposób: f(y)=(nny)pny(1−p)n(1−y)=exp(n[ylogp1−p−(−log(1−p))]+log(nny))f(y)=(nny)pny(1−p)n(1−y)=exp(n[ylogp1−p−(−log(1−p))]+log(nny)) f(y) = {n\choose{ny}} p^{ny} (1-p)^{n(1-y)} = \exp \left(n \left[ y \log \frac{p}{1-p} - \left(-\log (1-p)\right) \right] + \log {n \choose ny}\right) gdzie yyy …
Istnieje kilka prac matematycznych opisujących lasso bayesowskie, ale chcę przetestować poprawny kod JAGS, którego mogę użyć. Czy ktoś może opublikować próbkę kodu BŁĘDY / JAGS, który implementuje regulowaną regresję logistyczną? Każdy schemat (L1, L2, Elasticnet) byłby świetny, ale preferowany jest Lasso. Zastanawiam się także, czy istnieją ciekawe alternatywne strategie wdrażania.
To pytanie dotyczy praktyki lub metody stosowanej przez niektórych moich kolegów. Podczas tworzenia modelu regresji logistycznej widziałem, jak ludzie zastępują zmienne kategoryczne (lub zmienne ciągłe, które są binowane) ich odpowiednią wagą dowodu (WoE). Podobno ma to na celu ustanowienie monotonicznej relacji między regresorem a zmienną zależną. O ile rozumiem, po …
Zastosowałem regresję logistyczną do moich danych na SAS i oto krzywa ROC i tabela klasyfikacji. Czuję się dobrze z liczbami w tabeli klasyfikacji, ale nie jestem pewien, co pokazuje krzywa ROC i obszar pod nią. Wszelkie wyjaśnienia byłyby bardzo mile widziane.
Załóżmy, że mamy następujący model regresji logistycznej: logit(p)=β0+β1x1+β2x2logit(p)=β0+β1x1+β2)x2)\text{logit}(p) = \beta_0+\beta_{1}x_{1} + \beta_{2}x_{2} Czy jest szansą na zdarzenie, gdy x 1 = 0, a x 2 = 0 ? Innymi słowy, czy jest szansa na zdarzenie, gdy x 1 i x 2 są na najniższych poziomach (nawet jeśli nie jest to …
Próbuję zrozumieć koncepcję nadmiernej dyspersji w regresji logistycznej. Czytałem, że nadmierna dyspersja występuje wtedy, gdy zaobserwowana wariancja zmiennej odpowiedzi jest większa niż można by oczekiwać po rozkładzie dwumianowym. Ale jeśli zmienna dwumianowa może mieć tylko dwie wartości (1/0), to jak może mieć średnią i wariancję? Nie przeszkadza mi obliczanie średniej …
Biorąc pod uwagę zestaw danych z wynikami binarnymi i pewną macierzą predykcyjną , standardowy model regresji logistycznej szacuje współczynniki które maksymalizują prawdopodobieństwo dwumianowe. Gdy ma pełną pozycję, jest unikalny; gdy nie ma doskonałej separacji, jest skończona.y∈{0,1}ny∈{0,1}ny\in\{0,1\}^nX∈Rn×pX∈Rn×pX\in\mathbb{R}^{n\times p}βMLEβMLE\beta_{MLE}XXXβMLEβMLE\beta_{MLE} Czy ten model maksymalnego prawdopodobieństwa maksymalizuje AUC ROC (aka statystyka), czy też istnieje …
Zwykle w regresji logistycznej dopasowujemy model i uzyskujemy prognozy dotyczące zestawu treningowego. Następnie weryfikujemy krzyżowo te prognozy treningowe (coś takiego jak tutaj ) i decydujemy o optymalnej wartości progowej na podstawie czegoś takiego jak krzywa ROC. Dlaczego nie uwzględnimy weryfikacji krzyżowej progu w rzeczywistym modelu i nie przeszkolimy tego od …
Przewidywane klasy z (binarnej) regresji logistycznej są określane przy użyciu progu prawdopodobieństwa członkostwa w klasie generowanego przez model. Jak rozumiem, domyślnie używa się zwykle 0,5. Ale zmiana progu zmieni przewidywane klasyfikacje. Czy to oznacza, że próg jest hiperparametrem? Jeśli tak, dlaczego (na przykład) nie jest możliwe łatwe przeszukiwanie siatki progów …
Ostatnio musiałem przeczytać kilka artykułów z ekonomii (dziedzina, której nie znam zbyt dobrze). Zauważyłem jedną rzecz, że nawet gdy zmienna odpowiedzi jest binarna, modele regresji liniowej dopasowane za pomocą OLS są wszechobecne. Moje pytanie brzmi zatem: Dlaczego preferuje się regresję liniową, na przykład regresję logistyczną w dziedzinie ekonomii? Czy jest …
O ile mi wiadomo, różnica między modelem logistycznym a modelem odpowiedzi ułamkowej (frm) polega na tym, że zmienna zależna (Y), w której frm wynosi [0,1], ale logistyka to {0, 1}. Ponadto, frm używa estymatora quasi-prawdopodobieństwa do określenia jego parametrów. Zwykle możemy użyć glmdo uzyskania modeli logistycznych przez glm(y ~ x1+x2, …
Pracowałem nad modelem logistycznym i mam trudności z oceną wyników. Mój model to dwumianowy logit. Moje zmienne objaśniające to: zmienna kategorialna z 15 poziomami, zmienna dychotomiczna i 2 zmienne ciągłe. Mój N jest duży> 8000. Staram się modelować decyzję firm o inwestowaniu. Zmienna zależna to inwestycja (tak / nie), 15 …
Korzystam z modelu regresji logistycznej w postaci: lmer(response~1+(1|site), family=binomial, REML = FALSE) Normalnie obliczałbym ICC na podstawie przechwytywania i wariancji resztkowych, ale podsumowanie modelu nie obejmuje wariancji resztkowej. Jak to obliczyć?
Moje przewidywania pochodzące z modelu regresji logistycznej (glm w R) nie są ograniczone od 0 do 1, jak bym się spodziewał. Rozumiem, że regresja logistyczna polega na tym, że parametry wejściowe i modelowe są łączone liniowo, a odpowiedź jest przekształcana w prawdopodobieństwo za pomocą funkcji logit link. Ponieważ funkcja logit …
Mam grupę pacjentów z różną długością okresu obserwacji. Do tej pory pomijam aspekt czasowy i po prostu muszę wymodelować wynikową chorobę / brak choroby. W tych badaniach zwykle przeprowadzam regresję logistyczną, ale inny mój kolega zapytał, czy regresja Poissona byłaby równie odpowiednia. Nie przepadam za poissonem i nie byłem pewien, …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.