Pytania otagowane jako generalized-linear-model

Uogólnienie regresji liniowej pozwalające na relacje nieliniowe za pomocą „funkcji łącza” oraz na wariancję odpowiedzi zależną od przewidywanej wartości. (Nie należy mylić z „ogólnym modelem liniowym”, który rozszerza zwykły model liniowy na ogólną strukturę kowariancji i reakcję wielowymiarową).

1
Kiedy stosować dane GLM Poissona vs. geometryczne vs. ujemne dwumianowe?
Staram się układać dla siebie, gdy właściwe jest użycie typu regresji (geometrycznej, Poissona, dwumianu ujemnego) z danymi zliczania w ramach GLM (tylko 3 z 8 rozkładów GLM są używane do danych zliczania, chociaż większość z tego Czytałem centra wokół ujemnych rozkładów dwumianowych i Poissona). Kiedy stosować dane GLM Poissona vs. …


3
Regresja Poissona vs. regresja najmniejszych kwadratów?
Regresja Poissona jest GLM z funkcją log-link. Alternatywnym sposobem modelowania danych liczbowych o rozkładzie innym niż normalny jest przetwarzanie wstępne, biorąc dziennik (a raczej dziennik (1 + liczba) do obsługi zer). Jeśli wykonasz regresję metodą najmniejszych kwadratów w odpowiedziach na logarytm, czy jest to związane z regresją Poissona? Czy poradzi …

1
Dlaczego quasi-Poissona w GLM nie traktuje się jako specjalnego przypadku ujemnego dwumianu?
Próbuję dopasować uogólnione modele liniowe do niektórych zestawów danych zliczania, które mogą być rozproszone lub nie. Dwa obowiązujące tutaj rozkłady kanoniczne to Poisson i ujemny dwumianowy (Negbin), z EV i wariancjąμμ\mu V.rP.= μVarP=μVar_P = \mu V.rN.b= μ + μ2)θVarNB=μ+μ2θVar_{NB} = \mu + \frac{\mu^2}{\theta} który może być wyposażony w R z …

3
Jak obliczyć dobroć dopasowania w GLM (R)
Mam następujący wynik działania funkcji glm. Jak mogę zinterpretować następujące wartości: Odchylenie zerowe Pozostałe odchylenie AIC Czy mają coś wspólnego z dobrością dopasowania? Czy mogę obliczyć wartość dobroci dopasowania na podstawie tych wyników, takich jak kwadrat R lub jakakolwiek inna miara? Call: glm(formula = tmpData$Y ~ tmpData$X1 + tmpData$X2 + …

1
Od sieci bayesowskich po sieci neuronowe: w jaki sposób można zastosować regresję wielowymiarową do sieci z wieloma wyjściami
Mam do czynienia z bayesowskim hierarchicznym modelem liniowym , tutaj sieć go opisująca. YYY oznacza dzienną sprzedaż produktu w supermarkecie (zaobserwowano). XXX jest znaną matrycą regresorów, w tym cen, promocji, dnia tygodnia, pogody i świąt. S.S.S to nieznany ukryty poziom zapasów każdego produktu, który powoduje najwięcej problemów i który uważam …

1
Czy jest jakieś intuicyjne wyjaśnienie, dlaczego regresja logistyczna nie zadziała w przypadku idealnej separacji? A dlaczego dodanie uregulowania to naprawi?
Prowadzimy wiele dobrych dyskusji na temat idealnej separacji w regresji logistycznej. Takich jak regresja logistyczna w R doprowadziła do idealnej separacji (zjawisko Haucka-Donnera). Co teraz? a model regresji logistycznej nie jest zbieżny . Osobiście nadal uważam, że nie jest intuicyjne, dlaczego będzie to problem i dlaczego dodanie regularyzacji to rozwiąże. …

4
Radzenie sobie z wartościami 0,1 w regresji beta
Mam pewne dane w [0,1], które chciałbym przeanalizować za pomocą regresji beta. Oczywiście należy coś zrobić, aby uwzględnić wartości 0,1. Nie lubię modyfikować danych, aby pasowały do ​​modelu. również nie uważam, aby inflacja zero i 1 była dobrym pomysłem, ponieważ uważam, że w tym przypadku należy uznać wartości zerowe za …

2
Przekształcanie danych proporcji: gdy pierwiastek kwadratowy arcsin nie wystarczy
Czy istnieje (silniejsza?) Alternatywa dla transformacji pierwiastka kwadratowego arcsin dla danych procentowych / procentowych? W zbiorze danych, nad którym obecnie pracuję, znacząca heteroscedastyczność pozostaje po zastosowaniu tej transformacji, tj. Wykres wartości resztowych w stosunku do dopasowanych wartości jest nadal bardzo romboidalny. Edytowane, aby odpowiedzieć na komentarze: dane są decyzjami inwestycyjnymi …

3
Jak interpretować termin przechwytywania w GLM?
Używam R i analizowałem moje dane za pomocą GLM z łączem dwumianowym. Chcę wiedzieć, jakie jest znaczenie przecięcia w tabeli wyjściowej. Punkt przecięcia dla jednego z moich modeli jest znacząco inny, jednak zmienna tak nie jest. Co to znaczy? Co to jest przechwycenie. Nie wiem, czy po prostu się mylę, …

1
Jak traktuje się wartości „NA” w glm w R
Mam tabelę danych T1, która zawiera prawie tysiąc zmiennych (V1) i około 200 milionów punktów danych. Dane są rzadkie, a większość wpisów to NA. Każdy punkt danych ma unikalną parę identyfikatora i daty, aby odróżnić je od innych. Mam inną tabelę T2, która zawiera osobny zestaw zmiennych (V2). Ta tabela …


1
Dobroć dopasowania i który model wybrać regresję liniową lub Poissona
Potrzebuję porady dotyczącej dwóch głównych dylematów w moich badaniach, które są studium przypadku 3 dużych farmaceutyków i innowacji. Liczba patentów rocznie jest zmienną zależną. Moje pytania są Jakie są najważniejsze kryteria dobrego modelu? Co jest ważniejsze / mniej ważne? Czy to, że większość lub wszystkie zmienne będą znaczące? Czy to …

4
Najlepszy sposób radzenia sobie z heteroscedastycznością?
Mam wykres wartości resztkowych modelu liniowego w funkcji dopasowanych wartości, w których heteroscedastyczność jest bardzo wyraźna. Jednak nie jestem pewien, jak powinienem postępować teraz, ponieważ o ile rozumiem ta heteroscedastyczność powoduje, że mój model liniowy jest nieważny. (Czy to prawda?) Użyj solidnego dopasowania liniowego za pomocą rlm()funkcji MASSpakietu, ponieważ jest …

1
Dlaczego stosowanie metody Newtona do optymalizacji regresji logistycznej nazywa się iteracyjną, ponownie ważoną metodą najmniejszych kwadratów?
Dlaczego stosowanie metody Newtona do optymalizacji regresji logistycznej nazywa się iteracyjną, ponownie ważoną metodą najmniejszych kwadratów? Nie wydaje mi się to jasne, ponieważ utrata logistyczna i utrata najmniejszych kwadratów to zupełnie inne rzeczy.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.