Które dystrybucje mają rozwiązania zamknięte dla oszacowania maksymalnego prawdopodobieństwa?

21

Które rozkłady mają rozwiązania zamknięte dla maksymalnego prawdopodobieństwa oszacowania parametrów z próby niezależnych obserwacji?

distributions mathematical-statistics maximum-likelihood

— Pułkownik Panika
źródło

25

Bez znaczącej utraty ogólności możemy założyć, że gęstość prawdopodobieństwa (lub masa) dla każdej obserwacji (z obserwacji) jest ściśle dodatnia, co pozwala nam zapisać ją jako wykładniczą $f(x_i)$ $x_i$ $n$

f (x_{i}) = \exp (g (x_{i}, θ))

$f(x_i) = \exp{(g(x_i,\theta))}$

dla wektora parametru . $\theta = (\theta_j)$

Zrównanie gradientu funkcji logarytmu zera do zera (który znajduje stacjonarne punkty prawdopodobieństwa, wśród których będą wszystkie wewnętrzne maksima globalne, jeśli takie istnieją) daje zbiór równań postaci

\sum_{i} \frac{d g (x_{i}, θ)}{d θ_{j}} = 0,

$\sum_i\frac{d g(x_i, \theta)}{d\theta_j} = 0,$

po jednym dla każdego . Dla jednego z nich, aby mieć gotowe rozwiązanie, chcielibyśmy, aby móc oddzielić terminy Z kategoriach . (Wszystko wypływa z tego kluczowego pomysłu, motywowanego zasadą lenistwa matematycznego : wykonuj jak najmniej pracy; myśl przed obliczeniami; najpierw rozwiąż proste wersje trudnych problemów.) Najogólniejszym sposobem na zrobienie tego jest zastosowanie równań formularz $j$ $x_i$ $\theta$

\sum_{i} (η_{j} (θ) τ_{j} (x_{i}) - α_{j} (θ)) = η_{j} (θ) \sum_{i} τ_{j} (x_{i}) - n α_{j} (θ)

$\sum_i \left(\eta_j(\theta) \tau_j(x_i) - \alpha_j(\theta)\right) = \eta_j(\theta)\sum_i \tau_j(x_i) - n \alpha_j(\theta)$

dla znanych funkcji , i , ponieważ wówczas rozwiązanie uzyskuje się przez rozwiązanie równoczesnych równań $\eta_j$ $\tau_j$ $\alpha_j$

\frac{n α_{j} (θ)}{η_{j} (θ)} = \sum_{i} τ_{j} (x_{i})

$\frac{n\alpha_j(\theta)}{\eta_j(\theta)}= \sum_i \tau_j(x_i)$

dla . Zasadniczo będą one trudne do rozwiązania, ale pod warunkiem, że zestaw wartości poda pełne informacje o , moglibyśmy po prostu użyj tego wektora zamiast samego (tym samym nieco uogólniając ideę rozwiązania „zamkniętej formy”, ale w bardzo produktywny sposób). W takim przypadku całkowanie w odniesieniu do daje $\theta$ $\left(\frac{n\alpha_j(\theta)}{\eta_j(\theta)}\right)$ $\theta$ $\theta$ $\theta_j$

g (x, θ) = τ_{j} (x) \int^{θ} η_{j} (θ) d θ_{j} - \int^{θ} α_{j} (θ) d θ_{j} + B (x, θ_{j}^{'})

$g(x, \theta) = \tau_j(x)\int^\theta \eta_j(\theta) d\theta_j - \int^\theta \alpha_j(\theta) d\theta_j + B(x, \theta_j')$

(gdzie oznacza wszystkie składniki oprócz ). Ponieważ lewa strona jest funkcjonalnie niezależna od , musimy mieć to dla niektórych stałych funkcji ; że nie może w ogóle zależeć od ; a są pochodnymi niektórych funkcji a są pochodnymi niektórych innych funkcji , oba funkcjonalnie niezależne od danych. Skąd $\theta_j'$ $\theta$ $\theta_j$ $\theta_j$ $\tau_j(x)=T(x)$ $T$ $B$ $\theta$ $\eta_j$ $H(\theta)$ $\alpha_j$ $A(\theta)$

g (x, θ) = H (θ) T (x) - A (θ) + B (x) .

$g(x, \theta) = H(\theta)T(x) - A(\theta) + B(x).$

Gęstości, które można zapisać w tej formie, składają się na znaną rodzinę Koopman-Pitman-Darmois lub wykładniczą . Zawiera ważne rodziny parametryczne, zarówno ciągłe, jak i dyskretne, w tym gamma, normalne, chi-kwadrat, Poissona, wielomianowe i wiele innych .

— Whuber
źródło

A dla tych, którzy nie mają zamkniętych formularzy, moglibyśmy użyć algorytmu EM. Rozważmy na przykład naddeptany model Poissona

— Damien

0

Nie wiem, czy mógłbym wymienić je wszystkie. Przychodzą mi na myśl wykładnicze, normalne i dwumianowe i wszystkie należą do klasy rodzin wykładniczych. Rodzina wykładnicza ma wystarczającą statystykę w wykładniku, a mle jest często miłą funkcją tej wystarczającej statystyki.

— Michael R. Chernick
źródło

8

To pytanie jest niezwykle szerokie, ale wydaje się, że OP może pytać, co charakteryzuje dystrybucję, która ma zamknięte rozwiązanie dla MLE, zamiast prosić o wyczerpującą listę. W każdym razie wyczerpująca lista nie jest nawet możliwa.

— Makro

2

Nie zawsze jest to „ładna funkcja”, na przykład wystarczająca statystyka rozkładu beta wynosi , z których wymagane są metody numeryczne do znalezienia parametrów kształtu i .

[\log x \log (1 - x)]^{T}

$[\log x\; \log (1-x)]^{\rm T}$

a

$a$

b

$b$

— Neil G

Thnaks Neil za zwrócenie na to uwagi. Chyba nie wszystkie wykładnicze rodziny dystrybucji mają zamknięte rozwiązania.

— Michael R. Chernick,