Aby dodać do doskonałych odpowiedzi Carlosa i Xi'ana , warto również zauważyć, że wystarczającym warunkiem, aby dywergencja KL była skończona, jest to, aby obie zmienne losowe miały tę samą zwartą podporę, a granice gęstości odniesienia były ograniczone . Wynik ten ustanawia również domyślną granicę maksymalnej dywergencji KL (patrz twierdzenie i dowód poniżej).
Twierdzenie: Jeśli gęstości i mają to samo zwarte podłoże a gęstość jest ograniczona na tym podłożu (tj. Ma skończoną górną granicę), to .pqXpKL(P||Q)<∞
Dowód: Ponieważ ma kompaktowe wsparcie oznacza to, że istnieje pewna dodatnia wartość minimalna:qX
q–≡infx∈Xq(x)>0.
Podobnie, ponieważ ma kompaktowe wsparcie oznacza to, że istnieje pewna dodatnia wartość supremum:pX
p¯≡supx∈Xp(x)>0.
Ponadto, ponieważ oba są gęstościami na tym samym wsparciu, a to drugie jest ograniczone, mamy . To znaczy że:0<q–⩽p¯<∞
supx∈Xln(p(x)q(x))⩽ln(p¯)−ln(q–).
Teraz, pozwalając być ostatnią górną granicą, wyraźnie mamy więc że:L––≡ln(p¯)−ln(q–)0⩽L––<∞
KL(P||Q)=∫Xln(p(x)q(x))p(x)dx⩽supx∈Xln(p(x)q(x))∫Xp(x)dx⩽(ln(p¯)−ln(q–))∫Xp(x)dx=L––<∞.
To ustanawia wymaganą górną granicę, co potwierdza twierdzenie. ■