Entropia krzyżowa jest identyczna z dywergencją KL plus entropia rozkładu celu. KL równa się zero, gdy dwa rozkłady są takie same, co wydaje mi się bardziej intuicyjne niż entropia rozkładu docelowego, czyli taka, jaką entropia krzyżowa znajduje się w meczu.
Nie twierdzę, że w jednej z nich jest więcej informacji, z wyjątkiem tego, że ludzki pogląd może uznać zero za bardziej intuicyjne niż pozytywne. Oczywiście zwykle używa się metody oceny, aby naprawdę zobaczyć, jak dobrze zachodzi klasyfikacja. Ale czy wybór entropii krzyżowej nad KL jest historyczny?