To pytanie zastanawiało mnie od dawna. Rozumiem użycie „logu” w celu maksymalizacji prawdopodobieństwa, więc nie pytam o „log”.
Moje pytanie brzmi: skoro maksymalizacja prawdopodobieństwa dziennika jest równoważna z minimalizacją „negatywnego prawdopodobieństwa dziennika” (NLL), dlaczego wymyśliliśmy tę NLL? Dlaczego nie wykorzystujemy „pozytywnego prawdopodobieństwa” przez cały czas? W jakich okolicznościach preferowane jest NLL?
Znalazłem tutaj małe wyjaśnienie. https://quantivity.wordpress.com/2011/05/23/why-minimize-negative-log-likelihood/ i wydaje się wyjaśniać oczywistą równoważność dogłębnie, ale nie rozwiązuje mojego zamieszania.
Wszelkie wyjaśnienia będą mile widziane.