Obawiam się, że źle zrozumiałeś, co zamierza ten artykuł. Nie jest to żadną niespodzianką, ponieważ jest niejasno napisane. Działają się dwie różne rzeczy.
Pierwszym z nich jest po prostu praca w skali dziennika.
Oznacza to, że zamiast „ ” (gdy masz niezależność), zamiast tego można napisać „ log ( p A B ) = log ( p A ) + log ( p B ) ”. Jeśli potrzebujesz rzeczywistego prawdopodobieństwa, możesz potęgować na końcu, aby odzyskać p A B :pAB=pA⋅pBlog(pAB)=log(pA)+log(pB)pABpAB=elog(pA)+log(pB), ale jeśli zajdzie taka potrzeba, potęgowanie zwykle pozostawia się do ostatniego możliwego kroku. Jak na razie dobrze.
Druga część jest zastąpienie z - log p . Dzieje się tak, dlatego pracujemy z wartościami dodatnimi.logp−logp
Osobiście nie widzę w tym wiele wartości, zwłaszcza, że odwraca kierunek dowolnego uporządkowania ( rośnie monotonicznie, więc jeśli p 1 < p 2 , to log ( p A ) < log ( p 2 ) ; to kolejność jest odwrócona za pomocą - log p ).logp1<p2log(pA)<log(p2)−logp
logp
si=−log(pi)spAB=e−[sA+sB]. As you see, that reverses direction a second time, giving us back what we need.