Próbuję zrozumieć znormalizowaną formę punktowej wzajemnej informacji.
Dlaczego prawdopodobieństwo połączenia logarytmicznego normalizuje punktowe wzajemne informacje na poziomie [-1, 1]?
Punktowa wzajemna informacja to:
p (x, y) jest ograniczone przez [0, 1], więc log (p (x, y)) jest ograniczony przez (, 0). Wydaje się, że log (p (x, y)) powinien w jakiś sposób równoważyć zmiany w licznik, ale nie rozumiem dokładnie jak. Przypomina mi również entropię , ale znowu nie rozumiem dokładnego związku.