Przepraszam za spóźnioną odpowiedź, ale to mnie też wkurzyło i znalazłem odpowiedź. Rozkład jest rzeczywiście wielomianowy Dirichleta i indywidualny neg. rozkłady dwumianowe nawet nie muszą być identyczne, o ile ich współczynnik Fano (stosunek wariancji do średniej) jest identyczny.
Długa odpowiedź:
Jeśli sparametryzujesz NB jako:
p ( X= x | λ , θ ) = NB ( x | λ , θ ) = (θ- 1λ + x - 1x)(11 +θ- 1)x(θ- 11 +θ- 1)θ- 1λ
Następnie i imi( X) = λV.a r ( X) = λ ( 1 + θ )
∀ i :Xja∼ N.B (λja, θ ) implikuje
∑Xja∼ N.B ( ∑λja, θ )
Następnie przyjmując prawdopodobieństwo na podstawie sumy:
∏ NB (xja|λja, θ )N.B ( ∑xja| ∑λja, θ )=(11 +θ- 1)∑xja(θ- 11 +θ- 1)θ- 1∑λja∏ (θ- 1λja+xja- 1xja)(11 +θ- 1)∑xja(θ- 11 +θ- 1)θ- 1∑λja(θ- 1∑λja+ ∑xja- 1∑xja)==Γ ( ∑xja+ 1 ) Γ (θ- 1∑λja)Γ (θ- 1∑λja+∑xja)∏Γ (θ- 1λja+xja)Γ (xja+ 1 ) Γ(θ- 1λja)= D. M(x1, . . .,xn|θ- 1λ1, . . .,θ- 1λn)
gdzie jest prawdopodobieństwem wielomianowym Dirichleta. Wynika to po prostu z faktu, że oprócz współczynników wielomianowych, wiele terminów ułamka po lewej stronie anuluje się, pozostawiając tylko te funkcje funkcji gamma, które są takie same jak w przypadku prawdopodobieństwa DM.D M.
Należy również zauważyć, że parametrów tego modelu nie można zidentyfikować jako wzrostu przy jednoczesnym spadku wszystkich skutkuje dokładnie takim samym prawdopodobieństwem.θλja
Najlepsze odniesienia, jakie mam w tym zakresie, to sekcje od 2 do 3.1 Guimarães i Lindrooth (2007): Kontrolowanie nadmiernej dyspersji w zgrupowanych modelach logitów warunkowych: Prosta w obliczeniach aplikacja regresji wielomianowej Dirichleta - jest niestety opłacona, ale nie byłem w stanie znajdź odniesienie nieopłacone.