Niech będzie ścieżką łańcucha markowa i niech będzie prawdopodobieństwem zaobserwowania ścieżki, gdy jest prawdziwa wartość parametru (znana również jako funkcja prawdopodobieństwa dla ). Używając definicji prawdopodobieństwa warunkowego, wiemy{Xi}Ti=1Pθ(X1,...,XT)θθ
Pθ(X1,...,XT)=Pθ(XT|XT−1,...,X1)⋅Pθ(X1,...,XT−1)
Ponieważ jest to łańcuch markowa, wiemy, że , więc to upraszcza to doPθ(XT|XT−1,...,X1)=Pθ(XT|XT−1)
Pθ(X1,...,XT)=Pθ(XT|XT−1)⋅Pθ(X1,...,XT−1)
Teraz, jeśli powtórzysz tę samą logikę razy, otrzymaszT
Pθ(X1,...,XT)=∏i=1TPθ(Xi|Xi−1)
gdzie należy interpretować jako stan początkowy procesu. Terminy po prawej stronie są tylko elementami macierzy przejścia. Ponieważ żądano prawdopodobieństwa dziennika, ostateczna odpowiedź brzmi:X0
L(θ)=∑i=1Tlog(Pθ(Xi|Xi−1))
Jest to prawdopodobieństwo pojedynczego łańcucha markowa - jeśli twój zestaw danych zawiera kilka (niezależnych) łańcuchów markowa, pełne prawdopodobieństwo będzie sumą warunków tego formularza.