Konwersja (normalizacja) bardzo małych wartości prawdopodobieństwa na prawdopodobieństwo

Piszę algorytm, w którym przy danym modelu obliczam prawdopodobieństwa dla listy zestawów danych, a następnie muszę znormalizować (według prawdopodobieństwa) każde z prawdopodobieństw. Więc coś w rodzaju [0,00043, 0,00004, 0,00321] można przekonwertować na coś takiego jak [0,2, 0,03, 0,77].

Mój problem polega na tym, że prawdopodobieństwa dziennika, z którymi pracuję, są dość małe (na przykład w przestrzeni dziennika, wartości są takie jak -269647.432, -231444.981 itp.). W moim kodzie C ++, gdy próbuję dodać dwa z nich (biorąc ich wykładnik), otrzymuję odpowiedź „Inf”. Próbowałem dodać je w przestrzeni dziennika (sumowanie / odejmowanie dziennika) , ale znów natknąłem się na ten sam problem.

Czy ktoś może podzielić się swoją opinią na ten temat?

— Ikram
źródło

Kiedy używałeś funkcji, na które wskazałeś

\log (1 + \dots)

$\log(1+\dotsc)$ , czy używałeś tej log1pfunkcji w swoim języku? Wykorzystuje to rozszerzenie Taylora około 1.

— Neil G

Zobacz też kilka wcześniejszych powiązanych dyskusji tutaj

— Glen_b

Odejmij maksymalny logarytm od wszystkich dzienników. Wyrzuć wszystkie wyniki, które są tak negatywne, że będą zaniżać wartość wykładniczą. (Ich prawdopodobieństwa są dla wszystkich praktycznych celów zerowe.)

Rzeczywiście, jeśli chcesz względnej dokładności (takiej jak dla cyfr dokładności ) i masz prawdopodobieństw, odrzuć dowolny wynik mniejszy niż logarytm . Następnie postępuj jak zwykle, aby potęgować otrzymane wartości i podzielić każdą z nich przez sumę wszystkich wykładniczych. $\epsilon$ $\epsilon = 10^{-d}$ $d$ $n$ $\epsilon/n$

Dla tych, którzy lubią formuły, niech logarytmy będą wynosić z . Dla logarytmów do podstawy zdefiniuj $\lambda_1, \lambda_2, \ldots, \lambda_n$ $\lambda_n = \max(\lambda_i)$ $b\gt 1$

α_{ja} = {\begin{cases} b^{λ_{ja} - λ_{n}}, λ_{ja} - λ_{n} \geq \log (ϵ) - \log (n) \\ 0 Inaczej . \end{cases}

$\alpha_i = \cases{ b^{\lambda_i - \lambda_n}, \lambda_i - \lambda_n \ge \log(\epsilon)-\log(n) \\ 0\quad \text{otherwise}.}$

Znormalizowane prawdopodobieństwa wynoszą , Działa to, ponieważ zastąpienie wszystkich pozostałych niedomiarów przez zero powoduje całkowity błąd co najwyżej podczas gdy, ponieważ $\alpha_i / \sum_{j=1}^n \alpha_j$ $i = 1, 2, \ldots, n.$ $\alpha_i$ $(n-1)\epsilon/n\lt \epsilon$ i wszystkie są nieujemne mianownik , z którego całkowitawzględembłędu ze względu na zasady zerowej wymiany ściśle mniejszy niż , zgodnie z życzeniem. $\alpha_n=b^{\lambda_n-\lambda_n}=b^0=1$ $\alpha_i$ $A = \sum_j \alpha_j \ge 1$ $\left((n-1)\epsilon/n \right) / A \lt \epsilon$

Aby uniknąć zbyt dużego błędu zaokrąglania, oblicz sumę zaczynając od najmniejszych wartości . Nastąpi to automatycznie, gdy zostaną najpierw posortowane w porządku rosnącym. Jest to rozważane tylko dla bardzo dużej . $\alpha_i$ $\lambda_i$ $n$

BTW, ta recepta przyjęła, że baza dzienników jest większa niż . Dla zasad mniejszych niż , najpierw neguj wszystkie logi i postępuj tak, jakby baza była równa . $1$ $b$ $1$ $1/b$

Przykład

Niech będzie trzy wartości z logarytmów naturalnych (dzienniki, powiedzmy) jest równa i Ostatni jest największy; odejmując ją od każdej wartości daje a $-269647.432,$ $-231444.981,$ $-231444.699.$ $-38202.733,$ $-0.282,$ $0.$

Załóżmy, że chcesz dokładność porównywalną z IEEE podwójnej (około 16 miejsc po przecinku), tak że i . (Tak naprawdę nie można osiągnąć tej precyzji, ponieważ podaje się tylko trzem znaczącym liczbom, ale to w porządku: odrzucamy tylko te wartości, które z pewnością nie wpłyną na lepszą pożądaną precyzję mają) oblicz. = = $\epsilon=10^{-16}$ $n=3$ $-0.282$ $\log(\epsilon/n)$ $\log(10^{-16}) - \log(3)$ Pierwszy z trzech różnic jest mniejsza niż to, więc go wyrzucić, pozostawiając tylko i Exponentiating im daje i (oczywiście). Znormalizowane wartości wynoszą - w kolejności - dla wyrzuconego, i $-37.93997.$ $-38202.733,$ $-0.282$ $0.$ $\exp(-0.282) = 0.754$ $\exp(0)=1$ $0$ $0.754 / (1 + 0.754) = 0.430$ . $1/(1+0.754)=0.570$

— Whuber
źródło

To jest genialne - takie proste i tak oczywiste z perspektywy czasu. @Ikram, zaznacz to jako poprawną odpowiedź! (chyba że masz oczywiście coś lepszego, w takim przypadku prosimy o udostępnienie)

— zelanix,

@ Whuber czy w ogóle musimy wyrzucić

? Wykładanie, które i tak daje nam zero, a więc nie przyczyni się do sumy.

- 38202.733

$-38202.733$

— Taylor