Aby odpowiedzieć na twoje pytanie: możesz użyć gęstości wygładzania. Ale nie musisz. Odpowiedź Jarle Tufto ma rozkład, którego używasz. Ale są też inni.
Korzystanie z Kalman Recursions
Tutaj oceniasz prawdopodobieństwo jako
fa( y1, … , Yn) = f( y1) ∏i = 2nfa( yja| y1, … , Yi - 1) .
Jednak średnie i wariancje nie zawsze w pełni definiują rozkłady prawdopodobieństwa w ogóle. Poniżej znajduje się rozkład, którego używasz, aby przejść z filtrowania dystrybucji do prawdopodobieństw warunkowychf ( y i | y 1 , … , y i - 1 )fa( xi - 1| y1, … , Yi - 1)fa( yja| y1, … , Yi - 1) :
fa( yja| y1, … , Yi - 1) = ∬fa( yja| xja) f( xja| xi - 1) f( xi - 1| y1, … , Yi - 1) dxjarexi - 1.(1)
Tutaj to gęstość przejścia stanu ... część modelu, a to gęstość obserwacji ... część modelu ponownie. W swoim pytaniu piszesz je jako if ( y i | x i ) x t + 1 = F x t + v t + 1 y t = H x t + A z t + w tfa( xja| xi - 1)fa( yja| xja)xt + 1= F.xt+ vt + 1yt= Hxt+ A zt+ wt . To jest to samo.
Gdy pojawi się rozkład predykcji stanu o jeden krok do przodu, jest to obliczanie ∫fa( xja| xi - 1) f( xi - 1| y1, … , Yi - 1) dxi - 1 . Po ponownej integracji uzyskujesz (1) całkowicie. Zapisujesz tę gęstość całkowicie w swoim pytaniu, i to jest to samo.
Tutaj używasz tylko rozkładów rozkładów prawdopodobieństwa i założeń dotyczących modelu. To obliczenie prawdopodobieństwa jest dokładnym obliczeniem. Nie ma nic uznaniowego, czego można by użyć, aby zrobić to lepiej lub gorzej.
Korzystanie z algorytmu EM
Według mojej wiedzy nie ma innego sposobu oceny prawdopodobieństwa bezpośrednio w tego rodzaju modelu przestrzeni stanów. Nadal jednak można wykonać oszacowanie maksymalnego prawdopodobieństwa, oceniając inną funkcję: można użyć algorytmu EM. W kroku Oczekiwanie (E-krok) obliczasz
f ( y 1 , … , y n , x 1 , … , x n )
∫fa( x1, … , Xn| y1, … Yn) logfa( y1, … , Yn, x1, … , Xn) dx1 : n= Ey m O O T H[ logfa( y1, … , Yn, x1, … , Xn) ] .
Tutaj
fa( y1, … , Yn, x1, … , Xn)jest prawdopodobieństwem „kompletnych danych”, a ty bierzesz się za logarytm tego w odniesieniu do gęstości wygładzania połączenia. Często zdarza się, że ponieważ bierzesz dziennik tego pełnego prawdopodobieństwa danych, warunki dzielą się na sumy, a ze względu na liniowość operatora oczekiwania przyjmujesz oczekiwania w odniesieniu do krańcowych rozkładów wygładzania (tych wspominasz w swoim pytaniu).
Inne rzeczy
Czytałem w miejscach, że EM jest „bardziej stabilnym” sposobem na maksymalizację prawdopodobieństwa, ale tak naprawdę nigdy nie widziałem tego argumentu, ani też nie widziałem w ogóle tego słowa „stabilny”, ale też nie mam pojęcia naprawdę zbadałem to dalej. Żaden z tych algorytmów nie omija lokalnych / globalnych prób maksymalnych. Ja osobiście częściej używam Kalmana po prostu z przyzwyczajenia.
Prawdą jest, że wygładzone szacunki stanu mają zwykle mniejszą wariancję niż filtrowanie, więc myślę, że masz rację, jeśli chodzi o to, ale tak naprawdę nie używasz stanów. Prawdopodobieństwo, które próbujesz zmaksymalizować, nie jest funkcją stanów.