Funkcje dyskretne: zakres przedziału ufności?

Jak obliczyć pokrycie przedziału dyskretnego?

Co wiem jak to zrobić:

Gdybym miał model ciągły, mógłbym zdefiniować 95% przedział ufności dla każdej z moich przewidywanych wartości, a następnie zobaczyć, jak często rzeczywiste wartości mieściły się w przedziale ufności. Mogę stwierdzić, że tylko 88% czasu, w którym mój 95% przedział ufności obejmował rzeczywiste wartości.

Czego nie wiem jak to zrobić:

Jak to zrobić dla modelu dyskretnego, takiego jak Poissona lub Gamma-Poissona? To, co mam dla tego modelu, jest następujące, biorąc jedną obserwację (z ponad 100 000 planuję wygenerować :)

Obserwacja nr: (dowolna)

Wartość przewidywana: 1,5

Przewidywane prawdopodobieństwo 0: .223

Przewidywane prawdopodobieństwo 1: .335

Przewidywane prawdopodobieństwo 2: .251

Przewidywane prawdopodobieństwo 3: .126

Przewidywane prawdopodobieństwo 4: 0,048

Przewidywane prawdopodobieństwo 5: 0,014 [i 5 lub więcej to 0,019]

...(itp)

Przewidywane prawdopodobieństwo 100 (lub jakaś inna nierealna liczba): .000

Rzeczywista wartość (liczba całkowita, taka jak „4”)

Zauważ, że chociaż podałem powyżej wartości Poissona, w rzeczywistym modelu przewidywana wartość 1,5 może mieć różne przewidywane prawdopodobieństwa 0,1, ... 100 dla różnych obserwacji.

Jestem zdezorientowany dyskrecją wartości. „5” jest oczywiście poza przedziałem 95%, ponieważ jest tylko 0,019 przy 5 i powyżej, czyli mniej niż 0,025. Ale będzie ich dużo - pojedynczo są w środku, ale jak wspólnie lepiej oszacować liczbę 4?

Dlaczego mnie to obchodzi?

Modele, na które patrzę, zostały skrytykowane za to, że są dokładne na poziomie zagregowanym, ale dają słabe indywidualne prognozy. Chcę zobaczyć, o ile gorsze są słabe indywidualne przewidywania niż z natury szerokie przedziały ufności przewidywane przez model. Oczekuję, że zasięg empiryczny będzie gorszy (np. Mogę stwierdzić, że 88% wartości mieści się w 95% przedziale ufności), ale mam nadzieję, że tylko trochę gorzej.

confidence-interval discrete-data

— zbicyclist
źródło

Przedziały ufności Neymana nie podejmują próby zapewnienia pokrycia parametru w przypadku określonego przedziału. Zamiast tego zapewniają pokrycie wszystkich możliwych wartości parametrów w długim okresie. W pewnym sensie starają się być globalnie dokładne kosztem lokalnej dokładności.

Przedziały ufności dla proporcji dwumianowych stanowią wyraźną ilustrację tego problemu. Neymańska ocena przedziałów daje takie wykresy nieregularnego pokrycia, co dotyczy 95% przedziałów Cloppera-Pearsona dla n = 10 prób dwumianowych:

Wykres zasięgu Cloppera-Pearsona

Istnieje alternatywny sposób pokrycia, który moim zdaniem jest znacznie bardziej intuicyjny i (a więc) użyteczny. Pokrycie przedziałami może być określone w zależności od obserwowanego wyniku. Ten zasięg byłby zasięgiem lokalnym. Oto wykres pokazujący lokalne pokrycie dla trzech różnych metod obliczania przedziałów ufności dla proporcji dwumianowych: Clopper-Pearson, wyniki Wilsona oraz warunkowa dokładna metoda, która daje przedziały identyczne z przedziałami bayesowskimi z jednolitym wcześniejszym:

Warunkowe pokrycie dla trzech rodzajów przedziałów

Zauważ, że 95% metoda Cloppera-Pearsona daje ponad 98% zasięgu lokalnego, ale dokładne przedziały warunkowe są, no cóż, dokładne.

Sposobem na zastanowienie się nad różnicą między globalnym a lokalnym interwałem jest uznanie globalnego za odwrócenie testów hipotezy Neymana-Pearsona, gdzie wynik jest decyzją podejmowaną na podstawie uwzględnienia długoterminowych poziomów błędu dla bieżącego eksperymentuj jako członek globalnego zestawu wszystkich eksperymentów, które mogą zostać przeprowadzone. Lokalne interwały są bardziej zbliżone do inwersji testów istotności Fisheriana, które dają wartość P, która reprezentuje dowód na zero w tym konkretnym eksperymencie.

(O ile mi wiadomo, rozróżnienia między globalną a lokalną statystyką po raz pierwszy dokonano w niepublikowanej pracy magisterskiej Claire F. Leslie (1998). Brak pewności: badanie tłumienia niektórych kontrprzykładów w teorii Neymana-Pearsona wnioskowanie statystyczne, ze szczególnym odniesieniem do teorii przedziałów ufności. Tę tezę prowadzi biblioteka Baillieu na Uniwersytecie w Melbourne).

— Michael Lew
źródło

Nie sądzę, że Claire Leslie wymyśliła globalne / lokalne rozróżnienie, ale podała jej bardzo szczegółowy opis, z dużą ilością odniesień. Zbyt mocno polecam jej pracę magisterską.