Często zaleca się, aby wziąć pierwiastek kwadratowy, gdy zliczasz dane. (Aby zapoznać się z niektórymi przykładami CV, patrz odpowiedź @ Harveya Motulsky'ego tutaj lub odpowiedź @ whubera tutaj .) Z drugiej strony, podczas dopasowywania uogólnionego modelu liniowego ze zmienną odpowiedzi rozmieszczoną jako Poisson, log jest łącznikiem kanonicznym . Jest to …
Rozumiem, że w przypadku niektórych zestawów danych, takich jak głosowanie, wyniki są lepsze. Dlaczego regresję Poissona stosuje się zamiast zwykłej regresji liniowej lub regresji logistycznej? Jaka jest motywacja matematyczna?
Sprawdzam krzyżowo model, który próbuje przewidzieć liczbę. Gdyby to był problem z klasyfikacją binarną, obliczyłbym nieoczekiwane AUC, a jeśli byłby to problem regresji, obliczyłbym nieoczekiwanie RMSE lub MAE. W przypadku modelu Poissona, jakich mierników błędów mogę użyć do oceny „dokładności” prognoz poza próbą? Czy istnieje rozszerzenie AUC Poissona, które sprawdza, …
Obecnie mam trudności ze znalezieniem odpowiedniego modelu dla danych trudnych do zliczenia (zmienna zależna). Próbowałem różnych modeli (modele efektów mieszanych są niezbędne dla mojego rodzaju danych), takich jak lmeri lme4(z transformacją logarytmiczną), a także uogólnionych liniowych modeli efektów mieszanych z różnymi rodzinami, takimi jak dwumian Gaussa lub ujemny. Nie jestem …
Rozważ model przeszkodowy przewidujący zliczanie danych yz normalnego predyktora x: set.seed(1839) # simulate poisson with many zeros x <- rnorm(100) e <- rnorm(100) y <- rpois(100, exp(-1.5 + x + e)) # how many zeroes? table(y == 0) FALSE TRUE 31 69 W tym przypadku mam dane z 69 zerami …
Ujemny rozkład dwumianowy (NB) jest zdefiniowany na nieujemnych liczbach całkowitych i ma funkcję masy prawdopodobieństwa fa( k ; r , p ) = ( k + r - 1k) pk( 1 - p )r.f(k;r,p)=(k+r−1k)pk(1−p)r.f(k;r,p)={\binom {k+r-1}{k}}p^{k}(1-p)^{r}.Czy ma sens rozważenie ciągłego rozkładu na liczbach rzeczywistych nieujemnych zdefiniowanych przez tę samą formułę (zastępując …
Mam 17 lat (1995–2011) danych dotyczących aktu zgonu związanych ze śmiercią samobójczą dla stanu w USA. Istnieje wiele mitologii na temat samobójstw i miesięcy / pór roku, wiele z nich jest sprzecznych, a literatura I ” Po przejrzeniu recenzji nie rozumiem zastosowanych metod ani nie ufam wynikom. Dlatego postanowiłem sprawdzić, …
Niedawno zacząłem pracować w klinice gruźlicy. Spotykamy się okresowo w celu omówienia liczby przypadków gruźlicy, które obecnie leczymy, liczby przeprowadzonych testów itp. Chciałbym zacząć modelować te liczby, aby nie tylko zgadywać, czy coś jest niezwykłe, czy nie. Niestety, miałem niewiele szkoleń w szeregach czasowych i większość mojej ekspozycji dotyczyła modeli …
Staram się układać dla siebie, gdy właściwe jest użycie typu regresji (geometrycznej, Poissona, dwumianu ujemnego) z danymi zliczania w ramach GLM (tylko 3 z 8 rozkładów GLM są używane do danych zliczania, chociaż większość z tego Czytałem centra wokół ujemnych rozkładów dwumianowych i Poissona). Kiedy stosować dane GLM Poissona vs. …
Mam coś, co naiwnie uważałem za dość prosty problem, który polega na wykrywaniu wartości odstających dla wielu różnych zestawów danych zliczania. W szczególności chcę ustalić, czy jedna lub więcej wartości w serii danych zliczania jest wyższa lub niższa niż oczekiwano w stosunku do reszty zliczeń w rozkładzie. Czynnikiem zakłócającym jest …
Czy istnieje taki pakiet, który przewiduje oszacowanie modelu mieszanych efektów dwumianowych z zerowym napełnieniem ujemnym w R? Rozumiem przez to: Inflacja zerowa, w której można określić model dwumianowy dla inflacji zerowej, jak w funkcji zeroinfl w pakiecie pscl: zeroinfl (y ~ X | Z, dist = "negbin") gdzie Z jest …
Mam dane zliczania (analiza popytu / oferty z liczbą klientów, w zależności od - być może - wielu czynników). Próbowałem regresji liniowej z normalnymi błędami, ale mój wykres QQ nie jest naprawdę dobry. Próbowałem przekształcić log odpowiedzi: po raz kolejny zły wykres QQ. Więc teraz próbuję regresji za pomocą błędów …
Czy istnieje sposób ustalenia, czy różnica między liczbą wypadków drogowych w czasie 1 znacznie różni się od liczby wypadków w czasie 2? Znalazłem różne metody określania różnicy między grupami obserwacji w różnych momentach (np. Porównywanie średnich Poissona), ale nie do porównywania tylko dwóch zliczeń. A może próba wręcz jest nieprawidłowa? …
Chciałbym zastosować dane zliczania jako zmienne towarzyszące przy dopasowaniu modelu regresji logistycznej. Moje pytanie brzmi: Czy naruszam jakiekolwiek założenie modeli logistycznych (a bardziej ogólnie uogólnionych modeli liniowych), stosując jako zmienne niezależne zliczające, nieujemne zmienne całkowite? W literaturze znalazłem wiele odniesień dotyczących wykorzystania danych zliczających jako wyniku, ale nie jako zmiennych …
Mam zbiór danych o przypadkach incydentów według sezonu rzadkiej choroby. Powiedzmy, że na wiosnę było 180 przypadków, 90 latem, 45 jesienią, a 210 zimą. Mam problem z tym, czy do tych liczb należy dołączyć standardowe błędy. Cele badań są wnioskowe w tym sensie, że szukamy sezonowego wzorca zapadalności na choroby, …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.