Rozważ wektor parametrów , przy czym θ 1 to parametr będący przedmiotem zainteresowania, a θ 2 parametr uciążliwy.
Jeśli jest prawdopodobieństwo wykonana z danych x prawdopodobieństwo profil dla θ 1 jest określona jako L P ( θ 1 , x ) = L ( θ 1 , θ 2 ( θ 1 ) , x ) , gdzie θ 2 ( θ 1 ) jest MLE z θ 2dla stałej wartości .
Maksymalizacja prawdopodobieństwo profilu względem θ 1 prowadzi do tego samego oszacowania θ 1 jako uzyskanej poprzez zwiększenie prawdopodobieństwa równolegle względem θ 1 i θ 2 .
myślę odchylenie standardowe θ 1 może być również określona na drugiej pochodnej prawdopodobieństwa profilu.
Statystykę prawdopodobieństwo dla H 0 : θ 1 = θ 0 może być zapisana w odniesieniu do profilu prawdopodobieństwo: L R = 2 log ( l P ( θ 1 ; x ).
Wygląda więc na to, że prawdopodobieństwa profilu można użyć dokładnie tak, jakby to było prawdziwe prawdopodobieństwo. Czy to naprawdę tak jest? Jakie są główne wady tego podejścia? A co z „plotką”, że estymator uzyskany z prawdopodobieństwa profilu jest stronniczy (edytuj: nawet asymptotycznie)?