Pytania otagowane jako generalized-linear-model

Uogólnienie regresji liniowej pozwalające na relacje nieliniowe za pomocą „funkcji łącza” oraz na wariancję odpowiedzi zależną od przewidywanej wartości. (Nie należy mylić z „ogólnym modelem liniowym”, który rozszerza zwykły model liniowy na ogólną strukturę kowariancji i reakcję wielowymiarową).


1
Format wejściowy dla odpowiedzi w dwumianowym glm w R.
W Ristnieją trzy sposoby, aby sformatować dane wejściowe dla regresji logistycznej z wykorzystaniem glmfunkcji: Dane mogą być w formacie „binarnym” dla każdej obserwacji (np. Y = 0 lub 1 dla każdej obserwacji); Dane mogą być w formacie „Wilkinson-Rogers” (np. y = cbind(success, failure)), Przy czym każdy wiersz reprezentuje jeden zabieg; …

1
Czy możesz podać proste intuicyjne wyjaśnienie metody IRLS, aby znaleźć MLE GLM?
Tło: Staram się śledzić ocenę Princeton dotyczącą oszacowania MLE dla GLM . I zrozumieć podstawy szacowania MLE: likelihood, score, obserwowane i oczekiwane Fisher informationi Fisher scoringtechnika. I wiem, jak uzasadnić prostą regresję liniową estymacją MLE . Pytanie: Nie rozumiem nawet pierwszego wiersza tej metody :( Jaka intuicja kryje się za …

4
Interpretowanie wariancji efektu losowego w blasku
Przeglądam artykuł na temat zapylania, w którym dane są dystrybuowane dwumianowo (owoce dojrzewają lub nie). Użyłem więc glmerz jednym losowym efektem (pojedyncza roślina) i jednym stałym efektem (leczenie). Recenzent chce wiedzieć, czy roślina miała wpływ na zbiór owoców - ale mam problem z interpretacją glmerwyników. Czytałem w Internecie i wydaje …

1
Logma sprzężona z Gamma GLM a logarytmiczny Gaussian GLM a logarytm transformowany LM
Z moich wyników wynika, że ​​GLM Gamma spełnia większość założeń, ale czy jest to opłacalne ulepszenie w stosunku do transformowanego logarytmicznie LM? Większość literatury, którą znalazłem, dotyczyła Poissona lub dwumianowego GLM. Uważam, że artykuł OCENA OGÓLNYCH ZAŁOŻEŃ MODELI LINIOWYCH Z WYKORZYSTANIEM LANDOMIZACJI jest bardzo przydatny, ale brakuje w nim faktycznych …


1
Czy w przypadku uśredniania modelu GLM uśredniamy prognozy na skali łącza lub odpowiedzi?
Aby obliczyć prognozy uśrednione w modelu na skali odpowiedzi GLM, która jest „poprawna” i dlaczego? Obliczyć uśrednioną prognozę modelu na skali łącza, a następnie przekształcić wstecz do skali odpowiedzi, lub Wstecz przekształć prognozy do skali odpowiedzi, a następnie oblicz średnią modelową Prognozy są bliskie, ale nie równe, jeśli model jest …

2
Splajny w GLM i GAM
Czy to źle, że splajny są dostępne tylko w modelach GAM, a nie w modelach GLM? Słyszałem to jakiś czas temu i zastanawiam się, czy to tylko nieporozumienie, czy też ma w tym trochę prawdy. Oto ilustracja:


2
Ridge ukarał GLM za pomocą powiększania rzędów?
Czytałem, że regresję grzbietu można osiągnąć, po prostu dodając wiersze danych do oryginalnej macierzy danych, gdzie każdy wiersz jest konstruowany przy użyciu 0 dla zmiennych zależnych i pierwiastka kwadratowego kkk lub zero dla zmiennych niezależnych. Następnie dodaje się jeden dodatkowy wiersz dla każdej niezależnej zmiennej. Zastanawiałem się, czy można uzyskać …

1
Nadmierna dyspersja i alternatywy modelowania w modelach efektu losowego Poissona z przesunięciami
Podczas modelowania zliczania danych z badań eksperymentalnych przy użyciu eksperymentu wewnątrz przedmiotu napotkałem szereg praktycznych pytań. Krótko opisuję eksperyment, dane i to, co do tej pory zrobiłem, a następnie moje pytania. Cztery różne filmy pokazano sekwencyjnie grupie respondentów. Po każdym filmie przeprowadzany był wywiad, w którym policzyliśmy liczbę wystąpień niektórych …

1
Regresja logistyczna z splajnami regresji w R.
Opracowuję model regresji logistycznej oparty na danych retrospektywnych z krajowej bazy danych dotyczących urazów głowy w Wielkiej Brytanii. Kluczowym rezultatem jest 30-dniowa śmiertelność (oznaczona jako miara „przetrwania”). Inne miary z opublikowanymi dowodami znaczącego wpływu na wyniki poprzednich badań obejmują: Year - Year of procedure = 1994-2013 Age - Age of …

5
Jak wykonać przypisanie wartości w bardzo dużej liczbie punktów danych?
Mam bardzo duży zestaw danych i brakuje około 5% wartości losowych. Te zmienne są ze sobą skorelowane. Poniższy przykładowy zestaw danych R jest tylko zabawkowym przykładem z fałszywymi skorelowanymi danymi. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

2
Sprawdzanie resztek normalności w uogólnionych modelach liniowych
W pracy wykorzystano uogólnione modele liniowe (zarówno dwumianowe, jak i ujemne dwumianowe rozkłady błędów) do analizy danych. Ale w sekcji metod analizy statystycznej znajduje się następujące stwierdzenie: ... i po drugie poprzez modelowanie danych obecności za pomocą modeli regresji logistycznej oraz danych czasu poszukiwania za pomocą uogólnionego modelu liniowego (GLM). …

1
Czy występuje problem z wielokoliniowością i regresją splajnów?
Podczas korzystania z naturalnych (tj. Ograniczonych) splajnów sześciennych, tworzone funkcje podstawowe są wysoce współliniowe, a po zastosowaniu w regresji wydają się generować bardzo wysokie statystyki VIF (współczynnik inflacji wariancji), sygnalizując wielokoliniowość. Czy rozważając przypadek modelu do celów prognozowania, jest to problem? Wydaje się, że zawsze tak będzie ze względu na …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.