Mam zestaw danych szeregów czasowych, do którego próbuję dopasować ukryty model Markowa (HMM) w celu oszacowania liczby stanów ukrytych w danych. Mój pseudo-kod do tego jest następujący:
for( i in 2 : max_number_of_states ){
...
calculate HMM with i states
...
optimal_number_of_states = "model with smallest BIC"
...
}
Teraz, w zwykłych modelach regresji, BIC ma tendencję do faworyzowania najbardziej oszczędnych modeli, ale w przypadku HMM nie jestem pewien, czy to właśnie robi. Czy ktoś faktycznie wie, do jakiego rodzaju HMM dąży kryterium BIC? Jestem również w stanie uzyskać wartość AIC i wartość prawdopodobieństwa. Skoro próbuję wywnioskować prawdziwą całkowitą liczbę stanów, czy jedno z tych kryteriów jest „lepsze” od drugiego w tym celu?