Mam prawie takie same pytania: Jak mogę skutecznie modelować sumę losowych zmiennych Bernoulliego?
Ale ustawienie jest zupełnie inne:
, , ~ 20, ~ 0,1
Mamy dane dotyczące wyników zmiennych losowych Bernoulliego: ,
Jeśli oszacujemy z oszacowaniem maksymalnego prawdopodobieństwa (i uzyskamy ), okaże się, że jest znacznie większy niż oczekiwane według innych kryteriów:
Tak więc i nie mogą być traktowane jako niezależne (mają małą zależność).
Istnieje kilka takich ograniczeń: i (znane), które powinny pomóc w oszacowaniu .
Jak moglibyśmy spróbować modelować sumę losowych zmiennych Bernoulliego w tym przypadku?
Jaka literatura może być przydatna do rozwiązania zadania?
AKTUALIZACJA
Istnieje kilka innych pomysłów:
(1) Można założyć, że nieznana zależność między zaczyna się po 1 lub więcej sukcesach w serii. Więc kiedy, i .
(2) Aby korzystać z MLE, potrzebujemy najmniej wątpliwego modelu. Oto wariant:
if dla dowolnego k jeślii , a dla dowolnego k.
(3) Ponieważ interesujemy się tylko , możemy ustawić (prawdopodobieństwo sukcesów dla sum N- (k + 1) +1 od ogona). I użyj parametryzacji
(4) Użyj MLE dla modelu opartego na parametrach i z dla (i dowolnego ) oraz niektórych innych ograniczeń natywnych .
Czy wszystko jest w porządku z tym planem?
AKTUALIZACJA 2
Niektóre przykłady rozkładu empirycznego (czerwony) w porównaniu z rozkładem Poissona (niebieski) (średnie Poissona to 2,22 i 2,45, rozmiary próbek to 332 i 259):
Dla próbek (A1, A2) ze środkami Poissona 2.28 i 2.51 (wielkości próbek wynoszą 303 i 249):
W przypadku połączonych próbek A1 + A2 (wielkość próby wynosi 552):
Wygląda na to, że poprawka Poissona powinna być najlepszym modelem :).