„Domyślnym”, najczęściej stosowanym i opisywanym rozkładem wyboru danych zliczania jest rozkład Poissona . Najczęściej ilustruje to przykład pierwszego praktycznego zastosowania:
Praktyczne zastosowanie tej dystrybucji dokonał Władysław Bortkiewicz w 1898 r., Kiedy powierzono mu zadanie zbadania liczby żołnierzy armii pruskiej zabitych przypadkowo przez kopnięcia koni; eksperyment ten wprowadził rozkład Poissona do dziedziny inżynierii niezawodności.
λλ
mi( Y| X, β) = λ = exp( β0+ β1X1+ ⋯ + βkXk)
λ
Problem z wykorzystaniem rozkładu Poissona do danych rzeczywistych polega na tym, że zakłada on, że średnia jest równa wariancji. Naruszenie tego założenia nazywa się nadmierną dyspersją . W takich przypadkach zawsze można użyć modelu quasi-Poissona , logarytmiczno-liniowego modelu nie-Poissona (dla dużych liczb Poissona można aproksymować rozkładem normalnym), ujemnej regresji dwumianowej (ściśle związanej z Poissonem; patrz Berk i MacDonald, 2008) lub inne modele, opisane przez Stephana Kolassę .
Aby zapoznać się z przyjaznym wprowadzeniem do regresji Poissona, możesz także sprawdzić artykuły autorstwa Lavery'ego (2010) lub Coxe, Westa i Aikena (2009).
Lavery, R. (2010). Animowany przewodnik: wprowadzenie do regresji Poissona. Papier NESUG, SA04.
Coxe, S., West, SG, i Aiken, LS (2009). Analiza danych zliczeniowych: Delikatne wprowadzenie do regresji Poissona i jej alternatyw. Dziennik oceny osobowości, 91 (2), 121–136.
Berk, R. i MacDonald, JM (2008). Nadmierna dyspersja i regresja Poissona. Journal of Quantitative Criminology, 24 (3), 269–284.