Jest tu kilka problemów.
(1) Model musi być wyraźnie probabilistyczny . W prawie wszystkich przypadkach nie będzie żadnego zestawu parametrów, dla których lewa odpowiada RHS dla wszystkich swoich danych: nie będzie pozostałości. Musisz przyjąć założenia dotyczące tych pozostałości. Czy spodziewasz się, że będą wynosić średnio zero? Być symetrycznie dystrybuowanym? Być w przybliżeniu normalnie dystrybuowany?
Oto dwa modele, które zgadzają się z tym określonym, ale pozwalają na drastycznie odmienne zachowanie resztkowe (i dlatego zwykle skutkują różnymi oszacowaniami parametrów). Możesz zmieniać te modele, zmieniając założenia dotyczące wspólnej dystrybucji :ϵja
B: y i = β 0 exp ( β 1 x 1 i + … + β k x k i ) + ϵ i .
Odp .: y ja= β0exp( β1x1 i+… + Βkxk i+ ϵja)
B: y ja= β0exp( β1x1 i+ … + Βkxk i) + ϵja.
(Pamiętaj, że są to modele danych ; zwykle nie ma czegoś takiego jak szacunkowa wartość danych ).^ y iyjayja^
(2) Konieczność obsługi wartości zerowych dla wartości y oznacza, że podany model (A) jest zarówno zły, jak i nieodpowiedni , ponieważ nie może wytworzyć wartości zerowej bez względu na błąd losowy. Drugi model powyżej (B) dopuszcza zerowe (a nawet ujemne) wartości y. Nie należy jednak wybierać modelu wyłącznie na takiej podstawie. Powtórzmy 1: ważne jest, aby odpowiednio modelować błędy.
(3) Linearyzacja zmienia model . Zazwyczaj powoduje to modele takie jak (A), ale nie takie jak (B). Jest używany przez osoby, które przeanalizowały swoje dane wystarczająco, aby wiedzieć, że ta zmiana nie wpłynie znacząco na oszacowania parametrów oraz przez osoby, które nie są świadome tego, co się dzieje. (Wiele razy trudno odróżnić).
(4) Powszechnym sposobem radzenia sobie z możliwością zerowej wartości jest zaproponowanie, aby (lub niektóre jej ponowne wyrażanie, takie jak pierwiastek kwadratowy) miał ściśle dodatnią szansę na równe zero. Matematycznie mieszamy masę punktową („funkcję delta”) z innym rozkładem. Te modele wyglądają tak:y
fa( yja)θjot∼ F.( θ ) ;= βj 0+ βj 1x1 i+ ⋯ + βj kxk i
gdzie jest jednym z parametrów ukrytych w wektorze , jest rodziną sparametryzowanych rozkładów przez , i jest ponownym wyrażeniem (funkcja „link” uogólnionego modelu liniowego: patrz odpowiedź onestop). (Oczywiście więc = gdy ) Przykładami są zero-napompowane modele Poissona i ujemnego dwumianowego .Parfaθ[ f( Y) = 0 ] = θj + 1>0θFθ1,…,θjfyPrFθ[f(Y)≤t](1−θj+1)Fθ(t)t≠0
(5) Zagadnienia dotyczące budowy i dopasowania modelu są powiązane, ale różne . Jako prosty przykład, nawet zwykły model regresji można dopasować na wiele sposobów za pomocą najmniejszych kwadratów (co daje te same oszacowania parametrów co Maksymalne prawdopodobieństwo i prawie takie same standardowe błędy), iteracyjnie przeważone najmniejsze kwadraty , różne inne formy „ wytrzymałych najmniejszych kwadratów ” itp. Wybór dopasowania często opiera się na wygodzie, praktyczności ( np. dostępności oprogramowania), znajomości, nawyku lub konwencji, ale przynajmniej należy pomyśleć biorąc pod uwagę to, co jest właściwe dla założonego rozkładu warunków błędu , do czegoY=β0+β1X+ϵϵifunkcja straty dla problemu może być uzasadniona, a także możliwość wykorzystania dodatkowych informacji (takich jak wcześniejsza dystrybucja parametrów).