Załóżmy, że dopasowuję regresję dwumianową i uzyskuję oszacowania punktowe i macierz wariancji-kowariancji współczynników regresji. To pozwoli mi uzyskać CI dla oczekiwanego odsetka sukcesów w przyszłym eksperymencie,, ale potrzebuję CI dla obserwowanej proporcji. Opublikowano kilka powiązanych odpowiedzi, w tym symulację (załóżmy, że nie chcę tego robić) oraz link do Krishnamoorthya i in. (Który nie do końca odpowiada na moje pytanie).
Moje rozumowanie jest następujące: jeśli używamy tylko modelu dwumianowego, jesteśmy zmuszeni to założyć jest próbkowany z rozkładu normalnego (z odpowiednim Wald CI) i dlatego niemożliwe jest uzyskanie CI dla obserwowanej proporcji w postaci zamkniętej. Jeśli to założymyjest próbkowany z rozkładu beta, wtedy rzeczy są znacznie łatwiejsze, ponieważ liczba sukcesów będzie podążać za rozkładem dwumianowym. Będziemy musieli założyć, że nie ma niepewności w szacowanych parametrach beta, i .
Istnieją trzy pytania:
1) Teoretyczny: czy można stosować tylko oszacowania punktowe parametrów beta? Wiem, że aby zbudować CI do przyszłej obserwacji w wielokrotnej regresji liniowej
robią tę niepoprawność wariancji terminu, . Rozumiem (popraw mnie, jeśli się mylę), że w praktyce jest to uzasadnienie jest szacowany z dużo większą precyzją niż współczynniki regresji i nie zyskamy wiele, próbując uwzględnić niepewność . Czy podobne uzasadnienie ma zastosowanie do szacowanych parametrów beta, i ?
2) Jaki pakiet jest lepszy (R: gamlss-bb, betareg, aod ?; Mam również dostęp do SAS).
3) Biorąc pod uwagę oszacowane parametry beta, czy istnieje (przybliżony) skrót, aby uzyskać kwantyle (2,5%, 97,5%) w celu zliczenia przyszłych sukcesów lub, jeszcze lepiej, w odniesieniu do odsetka przyszłych sukcesów w rozkładzie dwumianowym.