Pytania otagowane jako zero-inflation

Nadmierne zera w zmiennej w porównaniu z określonym rozkładem odniesienia. Podejścia regresyjne obejmują modele napompowane przez zero i modele przeszkód (dwuczęściowe). W przypadku danych zliczania powszechne są modele z zerową inflacją i płotką oparte na rozkładach Poissona lub ujemnych rozkładach dwumianowych (ZIP / ZINB i HP / HNB).

4
Wykresy diagnostyczne dla regresji zliczania
Jakie wykresy diagnostyczne (i być może testy formalne) są najbardziej przydatne dla regresji, w których wynikiem jest zmienna licząca? Szczególnie interesują mnie modele Poissona i modele dwumianowe ujemne, a także ich odpowiedniki zerowe i przeszkodowe. Większość źródeł, które znalazłem, po prostu kreśli wartości resztkowe w stosunku do dopasowanych wartości bez …


3
Przykład: regresja LASSO z użyciem glmnet dla wyniku binarnego
Zaczynam bawić sięglmnet za pomocą regresji LASSO, gdzie moje wyniki zainteresowania są dychotomiczne. Poniżej utworzyłem małą próbną ramkę danych: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 


1
Kiedy stosować dane GLM Poissona vs. geometryczne vs. ujemne dwumianowe?
Staram się układać dla siebie, gdy właściwe jest użycie typu regresji (geometrycznej, Poissona, dwumianu ujemnego) z danymi zliczania w ramach GLM (tylko 3 z 8 rozkładów GLM są używane do danych zliczania, chociaż większość z tego Czytałem centra wokół ujemnych rozkładów dwumianowych i Poissona). Kiedy stosować dane GLM Poissona vs. …

4
Radzenie sobie z wartościami 0,1 w regresji beta
Mam pewne dane w [0,1], które chciałbym przeanalizować za pomocą regresji beta. Oczywiście należy coś zrobić, aby uwzględnić wartości 0,1. Nie lubię modyfikować danych, aby pasowały do ​​modelu. również nie uważam, aby inflacja zero i 1 była dobrym pomysłem, ponieważ uważam, że w tym przypadku należy uznać wartości zerowe za …


2
Dlaczego dokładnie regresja beta nie radzi sobie z zerami i zerami w zmiennej odpowiedzi?
Regresja beta (tj. GLM z rozkładem beta i zwykle funkcją logit link) jest często zalecana do radzenia sobie ze zmienną zależną od odpowiedzi przyjmującą wartości od 0 do 1, takie jak ułamki, stosunki lub prawdopodobieństwa: Regresja dla wyniku (stosunek lub ułamek) od 0 do 1 . Zawsze jednak twierdzi się, …


1
Jak modelować nieujemne dane ciągłe z zerowym napompowaniem?
Obecnie próbuję zastosować model liniowy ( family = gaussian) do wskaźnika różnorodności biologicznej, który nie może przyjmować wartości niższych niż zero, jest zawyżony i ciągły. Wartości mieszczą się w zakresie od 0 do nieco ponad 0,25. W rezultacie w resztkach modelu istnieje oczywisty wzorzec, którego nie udało mi się pozbyć: …

3
Czy model danych nieujemnych z grupowaniem zer (GLM Tweedie, GLM z zerowym napełnieniem itp.) Może przewidywać dokładne zera?
Rozkład Tweediego może modelować skośne dane z masą punktową równą zero, gdy parametr ppp (wykładnik w relacji średnia-wariancja) wynosi od 1 do 2. Podobnie model z napompowaniem zera (inaczej ciągły lub dyskretny) może mieć dużą liczbę zer. Mam problem ze zrozumieniem, dlaczego jest tak, że kiedy przewiduję lub obliczam dopasowane …

3
Zero zawyżonych dystrybucji, czym one są naprawdę?
Próbuję zrozumieć zerowe zawyżone rozkłady. Czym oni są? Jaki jest sens? Jeśli mam dane z wieloma zerami, to mógłbym dopasować regresję logistyczną, najpierw obliczyć prawdopodobieństwo zer, a następnie mógłbym usunąć wszystkie zera, a następnie dopasować regresję regularną, używając mojego wyboru rozkładu (np. Poissona). Potem ktoś powiedział mi: „hej, użyj zerowej …

1
Zerowana regresja Poissona
Załóżmy, że są niezależne iY=(Y1,…,Yn)′Y=(Y1,…,Yn)′ \textbf{Y} = (Y_1, \dots, Y_n)' Yi=0Yi=kwith probability pi+(1−pi)e−λiwith probability (1−pi)e−λiλki/k!Yi=0with probability pi+(1−pi)e−λiYi=kwith probability (1−pi)e−λiλik/k!\eqalign{ Y_i = 0 & \text{with probability} \ p_i+(1-p_i)e^{-\lambda_i}\\ Y_i = k & \text{with probability} \ (1-p_i)e^{-\lambda_i} \lambda_{i}^{k}/k! } Również załóżmy PARAMETRY i P = ( P 1 , ... , p …

1
Trudności ze znalezieniem odpowiedniego modelu dopasowanego do danych zliczających z mieszanymi efektami - ZINB czy coś innego?
Mam bardzo mały zestaw danych na temat liczebności pojedynczych pszczół, które mam problemy z analizą. Są to dane zliczania i prawie wszystkie zliczenia są w jednym traktowaniu, a większość zer w drugim traktowaniu. Istnieje również kilka bardzo wysokich wartości (po jednej w dwóch z sześciu miejsc), więc rozkład zliczeń ma …


1
Miara „dewiacji” dla zerowo napompowanego Poissona czy napompowanego zerowo dwumianu?
Skalowane odchylenie, zdefiniowane jako D = 2 * (logarytmiczne prawdopodobieństwo modelu nasyconego minus logarytmiczne prawdopodobieństwo modelu dopasowanego), jest często stosowane jako miara dobroci dopasowania w modelach GLM. Wyjaśnione procentowe odchylenie, zdefiniowane jako [D (model zerowy) - D (model dopasowany)] / D (model zerowy), jest również czasami używane jako analog GLM …

3
GLM z ciągłymi danymi zgromadzonymi na zerze
Próbuję uruchomić model, aby oszacować, w jaki sposób katastrofalne choroby, takie jak gruźlica, AIDS itp. Wpływają na wydatki na hospitalizację. Mam „na koszt hospitalizacji” jako zmienną zależną i różne indywidualne markery jako zmienne niezależne, z których prawie wszystkie są obojętne, takie jak płeć, głowa gospodarstwa domowego, stan ubóstwa i oczywiście …



1
Średnia i wariancja zerowo napompowanego rozkładu Poissona
Czy ktokolwiek może pokazać, w jaki sposób oczekiwana wartość i wariancja zerowego nadciśnionego Poissona, z funkcją masy prawdopodobieństwa f(y)={π+(1−π)e−λ,(1−π)λye−λy!,if y=0if y=1,2....f(y)={π+(1−π)e−λ,if y=0(1−π)λye−λy!,if y=1,2.... f(y) = \begin{cases} \pi+(1-\pi)e^{-\lambda}, & \text{if }y=0 \\ (1-\pi)\frac{\lambda^{y}e^{-\lambda}}{y!}, & \text{if }y=1,2.... \end{cases} gdzie jest prawdopodobieństwem, że obserwacja wynosi zero w procesie dwumianowym, a jest średnią Poissona?ππ\piλλ\lambda …

2
Właściwe stosowanie i interpretacja modeli nadmuchanych zerowo
Tło: Jestem obecnie biostatystą zmagającym się z zestawem danych dotyczących ekspresji komórkowej. W badaniu narażono wiele peptydów na wiele komórek zebranych w grupach od różnych dawców. Komórki albo wyrażają określone biomarkery w odpowiedzi, albo nie. Wskaźniki odpowiedzi są następnie rejestrowane dla każdej grupy dawcy. Wskaźniki odpowiedzi (wyrażone w procentach) są …

2
GAMM z zerowymi danymi
Czy można dopasować GAMM (uogólniony model mieszany dodatków) dla danych z zerowym napełnieniem w R? Jeśli nie, to czy można dopasować GAM (uogólniony model addytywny) dla danych z zerowym napełnieniem z ujemnym dwumianowym lub quasi-rozkładem Poissona w R? (Znalazłem funkcje COZIGAM :: zigam i mgcv: ziP dla rozkładu Poissona)

2
Czy Poisson i podstawowy Poisson są obcinane przez zero, czy zagnieżdżone?
Widziałem wiele, które dyskutują, czy podstawowa regresja Poissona jest zagnieżdżoną wersją zerowej regresji Poissona. Na przykład ta strona twierdzi, że tak jest, ponieważ ta ostatnia zawiera dodatkowe parametry w celu modelowania dodatkowych zer, ale poza tym zawiera te same parametry regresji Poissona, co pierwsza, chociaż strona zawiera odwołanie, które się …


1
Jak uzyskać standardowe błędy z regresji danych zliczanych z zerową liczbą R? [Zamknięte]
Zamknięte. To pytanie jest nie na temat . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było tematem dotyczącym weryfikacji krzyżowej. Zamknięte 2 lata temu . Poniższy kod PredictNew <- predict (glm.fit, newdata = Predict, X1 =X1, Y1= Y1, type = "response", se.fit = TRUE) tworzy 3-kolumnowy …
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.