W rozdziale 2 Matrix Cookbook znajduje się niezły przegląd rachunku macierzy, który daje wiele przydatnych tożsamości, które pomagają w rozwiązywaniu problemów związanych z prawdopodobieństwem i statystykami, w tym regułami, które pomagają rozróżnić wielowymiarowe prawdopodobieństwo Gaussa.
Jeśli masz losowy wektor który jest wielowymiarowy normalny ze średnim wektorem i macierzą kowariancji , użyj równania (86) w książce kucharskiej macierzy, aby ustalić, że gradient prawdopodobieństwo dziennika w odniesieniu do wynosiμ Σ L μyμΣLμ
∂L∂μ=−12(∂(y−μ)′Σ−1(y−μ)∂μ)=−12(−2Σ−1(y−μ))=Σ−1(y−μ)
Pozostawiam tobie, abyś to ponownie rozróżniał i znalazł odpowiedź na: .−Σ−1
Jako „dodatkowy kredyt” użyj równań (57) i (61), aby stwierdzić, że gradient względem wynosiΣ
∂L∂Σ=−12(∂log(|Σ|)∂Σ+∂(y−μ)′Σ−1(y−μ)∂Σ)=−12(Σ−1−Σ−1(y−μ)(y−μ)′Σ−1)
Pominąłem wiele kroków, ale wykonałem to wyprowadzenie, używając tylko tożsamości znalezionych w macierzowej książce kucharskiej, więc zostawię to tobie, aby wypełnić luki.
Użyłem tych równań punktowych do oszacowania maksymalnego prawdopodobieństwa, więc wiem, że są poprawne :)