Powyższe odpowiedzi są bardziej intuicyjne, więc staram się bardziej rygorystycznie.
Co to jest GLM?
Niech oznacza zbiór odpowiedź Y i p -wymiarowego wektora współzmienna x = ( x 1 , ... , x p ) o wartość oczekiwana E ( Y ) = ľ . Dla i = 1 , ... , n niezależnych obserwacji rozkład każdego y I jest wykładniczy rodziny o gęstości
F ( y I ;Y= ( y, x )ypx =( x1, … , Xp)mi( y) = μi = 1 , … , nyja
Tutaj interesującym parametrem (parametr naturalny lub kanoniczny) jest θ i , ϕ jest a parametr skali (znany lub postrzegany jako uciążliwy) oraz γ i τ są znanymi funkcjami. Gdy n -wymiarowych wektory stałych wartościach wejściowych na str
fa( yja; θja, ϕ ) = exp{ [ yjaθja- γ( θja) ] / ϕ + τ( yja, ϕ ) }
θjaϕγτnpzmienne objaśniające oznaczone są przez
. Zakładamy, że wektory wejściowe wpływają (1) tylko przez funkcję liniową, predyktor liniowy,
η i = β 0 + β 1 x i 1 + ⋯ + β p x i p,
od których zależy
θ i . Jak można wykazać, że
θ = ( γ ′ ) - 1 ( μ )x1,…,xpηi=β0+β1xi1+⋯+βpxip
θiθ=(γ′)−1(μ), tę zależność ustala się, łącząc predyktor liniowy
i
θ za pomocą średniej. Mówiąc dokładniej, średnia
μ jest postrzegana jako odwracalna i gładka funkcja predyktora liniowego, tj.
G ( μ ) = η lub μ = g - 1 ( η )
Teraz, aby odpowiedzieć na twoje pytanie:
ηθμg(μ)=η or μ=g−1(η)
g(⋅)μηθη≡θg=(γ′)−1
X′y∑ixijyij=1,…,pμ
Dlatego zazwyczaj są używane. Zauważ jednak, że nie ma a priori powodu, dla którego efekty w modelu powinny być addytywne w skali podanej przez to lub inne łącze.