Pytanie
Wariancja ujemnego rozkładu dwumianowego (NB) jest zawsze większa niż jego średnia. Gdy średnia próbki jest większa niż jej wariancja, próba dopasowania parametrów NB z maksymalnym prawdopodobieństwem lub oszacowaniem momentu zakończy się niepowodzeniem (nie ma rozwiązania z parametrami skończonymi).
Jednak możliwe jest, że próbka pobrana z rozkładu NB ma wartość większą niż wariancja. Oto powtarzalny przykład w R.
set.seed(167)
x = rnbinom(100, size=3.2, prob=.8);
mean(x) # 0.82
var(x) # 0.8157576
Istnieje niezerowe prawdopodobieństwo, że NB wytworzy próbkę, dla której parametrów nie można oszacować (metodami największego prawdopodobieństwa i momentu).
- Czy można podać godne szacunki dla tej próbki?
- Co mówi teoria estymacji, gdy estymatory nie są zdefiniowane dla wszystkich próbek?
O odpowiedzi
Odpowiedzi @MarkRobinson i @Yves uświadomiły mi, że parametryzacja jest głównym problemem. Gęstość prawdopodobieństwa NB jest zwykle zapisywana jako
lub jako P(X=k)=Γ(r+k)
W ramach pierwszej parametryzacji maksymalne oszacowanie prawdopodobieństwa wynosi ilekroć wariancja próbki jest mniejsza niż średnia, więc nic użytecznego nie można powiedzieć o p . W drugim przypadku jest to ( ∞ , ˉ x ) , więc możemy podać rozsądne oszacowanie m . Wreszcie @ MarkRobinson pokazuje, że możemy rozwiązać problem nieskończonych wartości za pomocą r zamiastr.
Podsumowując, nie ma nic zasadniczo złego w tym problemie estymacji, z wyjątkiem tego, że nie zawsze można podać sensowne interpretacje i p dla każdej próbki. Szczerze mówiąc, pomysły są zawarte w obu odpowiedziach. Wybrałem ten z @ MarkRobinson jako poprawny dla uzupełnień, które on daje.