Estymatory maksymalnego prawdopodobieństwa dla skróconego rozkładu

Rozważmy $N$ niezależnych próbek $S$ otrzymano z losowej zmiennej $X$ , który jest przyjmowany śledzić skróconą dystrybucji (np obcięty rozkład normalny ) znanego (Finite) minimalne i maksymalne wartości $a$ i $b$ , lecz z nieznanych parametrów $\mu$ i $\sigma^2$ . Jeśli $X$ następnie non-obcięte rozkładzie estymatorów największej wiarygodności i do i z byłoby średniej próbki $\widehat\mu$ $\widehat\sigma^2$ $\mu$ $\sigma^2$ $S$ i wariancją Próbka $\widehat\mu = \frac{1}{N} \sum_i S_i$ . Jednak w przypadku skróconego rozkładu wariancja próbki zdefiniowana w ten sposób jest ograniczona przezwięc nie zawsze jest to spójny estymator: dlanie może zbiegać się z prawdopodobieństwem dogdyprzechodzi w nieskończoność. Tak więc wydaje się, że inie są estymatory największej wiarygodności z $\widehat\sigma^2 = \frac{1}{N} \sum_i (S_i - \widehat\mu)^2$ $(b-a)^2$ $\sigma^2 > (b-a)^2$ $\sigma^2$ $N$ $\widehat\mu$ $\widehat\sigma^2$ $\mu$ i dla skróconego rozkładu. Oczywiście należy się tego spodziewać, ponieważ parametry i skróconego rozkładu normalnego nie są jego średnią i wariancją. $\sigma^2$ $\mu$ $\sigma^2$

Jakie zatem są estymatory maksymalnego prawdopodobieństwa parametrów i skróconego rozkładu znanych wartości minimalnych i maksymalnych? $\mu$ $\sigma$

— a3nm
źródło

Czy jesteś pewien swojej analizy? Wydaje mi się, że przyjmujesz błędne założenie: w przypadku okrojonej MLE

nie jest już wariancją próbki (i ogólnie, MLE

nie jest już średnią próbki)!

σ^{2}

$\sigma^2$

μ

$\mu$

— whuber

whuber: Wiem, to jest dokładnie moje pytanie: jakie są MLE

w skróconym przypadku? Dodanie zdania, aby nalegać na to.

σ^{2}

$\sigma^2$

μ

$\mu$

— a3nm

Nie ma rozwiązania w formie zamkniętej. Wszystko, co możesz zrobić, to zminimalizować prawdopodobieństwo dziennika. Ale jakościowo nie różni się to od wielu innych modeli, takich jak regresja logistyczna, które również nie mają rozwiązania w formie zamkniętej.

— whuber

whuber: Jeśli to prawda, to jest dość rozczarowujące. Czy masz referencje na temat braku zamkniętych rozwiązań? Czy istnieją estymatory w formie zamkniętej, które nie mają maksymalnego prawdopodobieństwa, ale są przynajmniej spójne (i opcjonalnie obiektywne?).

— a3nm

@whuber: Czy możesz przynajmniej uprościć próbki w wystarczające statystyki, aby minimalizacja była szybka?

— Neil G

Rozważ dowolną rodzinę w skali lokalizacji określoną przez „standardowy” rozkład , $F$

Ω_{F} = {F_{(μ, σ)} : x \to F (\frac{x - μ}{σ}) ∣ σ > 0} .

$\Omega_F = \left\{F_{(\mu, \sigma)}: x \to F\left(\frac{x-\mu}{\sigma}\right) \mid \sigma \gt 0\right\}.$

Zakładając, że rozróżnialny, z łatwością stwierdzamy, że pliki PDF to $F$ . $\frac{1}{\sigma}f\left((x-\mu)/\sigma\right)dx$

Obcinania tych rozkładów ograniczyć ich powiązania pomiędzy i , , oznacza, że zastępuje się pliki PDF $a$ $b$ $a \lt b$

f_{(μ, σ; a, b)} (x) = \frac{f (\frac{x - μ}{σ}) d x}{σ C (μ, σ, a, b)}, a \leq x \leq b

$f_{(\mu, \sigma; a,b)}(x) = \frac{f\left(\frac{x-\mu}{\sigma}\right)dx}{\sigma C(\mu, \sigma, a, b)}, a \le x \le b$

(i są zerami dla wszystkich innych wartości ) gdzie jest czynnikiem normalizującym potrzebnym do zapewnienia, że całkuje się w jedność. (Zauważ, że jest identycznie $x$ $C(\mu, \sigma, a, b) = F_{(\mu,\sigma)}(b) - F_{(\mu,\sigma)}(a)$ $f_{(\mu, \sigma; a, b)}$ $C$ $1$ przy braku obcięcia.) Prawdopodobieństwo dziennika dla danych iid wynosi zatem $x_i$

Λ (μ, σ) = \sum_{i} [\log f (\frac{x_{i} - μ}{σ}) - \log σ - \log C (μ, σ, a, b)] .

$\Lambda(\mu, \sigma) = \sum_i \left[\log{f\left(\frac{x_i-\mu}{\sigma}\right)} - \log{\sigma}-\log{C(\mu, \sigma, a, b)}\right].$

Critical points (including any global minima) are found where either $\sigma=0$ (a special case I will ignore here) or the gradient vanishes. Using subscripts to denote derivatives, we may formally compute the gradient and write the likelihood equations as

\begin{aligned} 0 & = \frac{\partial Λ}{\partial μ} & = \sum_{i} [\frac{- f_{μ} (\frac{x_{i} - μ}{σ})}{f (\frac{x_{i} - μ}{σ})} - \frac{C_{μ} (μ, σ, a, b)}{C (μ, σ, a, b)}] \\ 0 & = \frac{\partial Λ}{\partial σ} & = \sum_{i} [\frac{- f_{σ} (\frac{x_{i} - μ}{σ})}{σ^{2} f (\frac{x_{i} - μ}{σ})} - \frac{1}{σ} - \frac{C_{σ} (μ, σ, a, b)}{C (μ, σ, a, b)}] \end{aligned}

$\eqalign{ 0 &= \frac{\partial\Lambda}{\partial\mu} &= \sum_i \left[\frac{-f_\mu\left(\frac{x_i-\mu}{\sigma}\right)}{f\left(\frac{x_i-\mu}{\sigma}\right)} -\frac{C_\mu(\mu,\sigma,a,b)}{C(\mu,\sigma,a,b)}\right] \\ 0 &= \frac{\partial\Lambda}{\partial\sigma} &= \sum_i \left[\frac{-f_\sigma\left(\frac{x_i-\mu}{\sigma}\right)}{\sigma^2f\left(\frac{x_i-\mu}{\sigma}\right)} -\frac{1}{\sigma}-\frac{C_\sigma(\mu,\sigma,a,b)}{C(\mu,\sigma,a,b)}\right] }$

Because $a$ and $b$ are fixed, drop them from the notation and write $nC_\mu(\mu, \sigma, a, b)/C(\mu, \sigma,a,b)$ as $A(\mu,\sigma)$ and $nC_\sigma(\mu, \sigma, a, b)/C(\mu, \sigma,a,b)$ as $B(\mu, \sigma)$ . (With no truncation, both functions would be identically zero.) Separating the terms involving the data from the rest gives

\begin{aligned} - A (μ, σ) & = \sum_{i} \frac{f_{μ} (\frac{x_{i} - μ}{σ})}{f (\frac{x_{i} - μ}{σ})} \\ - σ^{2} B (μ, σ) - n σ & = \sum_{i} \frac{f_{σ} (\frac{x_{i} - μ}{σ})}{f (\frac{x_{i} - μ}{σ})} \end{aligned}

$\eqalign{ -A(\mu,\sigma) &= \sum_i \frac{f_\mu\left(\frac{x_i-\mu}{\sigma}\right)}{f\left(\frac{x_i-\mu}{\sigma}\right)} \\ -\sigma^2 B(\mu,\sigma) - n\sigma &= \sum_i \frac{f_\sigma\left(\frac{x_i-\mu}{\sigma}\right)}{f\left(\frac{x_i-\mu}{\sigma}\right)} }$

By comparing these to the no-truncation situation it is evident that

Any sufficient statistics for the original problem are sufficient for the truncated problem (because the right hand sides have not changed).
Our ability to find closed-form solutions relies on the tractability of $A$ and $B$ . If these do not involve $\mu$ and $\sigma$ in simple ways, we cannot hope to obtain closed-form solutions in general.

For the case of a normal family, $C(\mu,\sigma,a,b)$ of course is given by the cumulative normal PDF, which is a difference of error functions: there is no chance that a closed-form solution can be obtained in general. However, there are only two sufficient statistics (the sample mean and variance will do) and the CDF is as smooth as can be, so numerical solutions will be relatively easy to obtain.

— whuber
źródło

Thanks a lot for this very detailed answer! I'm not sure I get what

f_{μ}

$f_\mu$ ,

f_{σ}

$f_\sigma$ ,

C_{μ}

$C_\mu$ , and

C_{σ}

$C_\sigma$ are, could you define them? Also, it's obvious but to be precise maybe you could say that your expression for the pdf is for

x \in [a, b]

$x \in [a, b]$ (and the pdf is zero outside of that). Thanks again!

— a3nm

The usual longer notation is

C_{μ} = \frac{\partial}{\partial μ} C (μ, σ, a, b)

$C_\mu = \frac{\partial}{\partial\mu}C(\mu,\sigma,a,b)$ , etc: as announced, it is a derivative. I will make the second change you suggest because it's an important clarification, thanks.

— whuber

Also, since your answer is more general than the one I expected, I edited my question to insist less on the case of normal distributions. Thanks again for your effort.

— a3nm

It was easier to explain at this level of generality compared to focusing on the Normal distributions! Computing the derivatives and showing the precise form of the CDF are unnecessary distractions (although useful when you start actually coding the numerical solution).

— whuber

Thanks for fixing! You missed one of them; could you review my edit?

— a3nm