W ramach mojej pracy magisterskiej pracuję nad opracowaniem modelu statystycznego dla przejść między różnymi stanami, określonego statusem serologicznym. Na razie nie podam zbyt wielu szczegółów w tym kontekście, ponieważ moje pytanie jest bardziej ogólne / teoretyczne. W każdym razie, mam intuicję, że powinienem używać ukrytego modelu Markowa (HMM); Problemem, który napotykam, gdy przeglądam literaturę i inne badania podstawowe niezbędne do sformułowania mojego modelu, jest zamieszanie w terminologii i dokładne różnice między różnymi typami ukrytych modeli procesów. Jestem bardzo niejasno świadomy tego, co je wyróżnia (przykłady, które nadchodzą). Ponadto wydaje mi się, że przynajmniej z tego, co widziałem w literaturze, istnieje bardzo niestandardowe słownictwo zbudowane wokół tego rodzaju modelowania,
Miałem więc nadzieję, że ludzie pomogą mi ujednoznacznić niektóre z tych warunków. Mam wiele pytań, ale domyślam się, że gdy jedno lub dwa zostaną zadowalająco odpowiedziane, reszta zostanie w rezultacie rozplątana. Mam nadzieję, że to nie jest zbyt rozwlekłe; jeśli moderator chce, żebym podzielił to na wiele postów, zrobię to. W każdym razie pogrubiłem moje pytania, a następnie szczegółowo pytanie, które odkryłem podczas przeszukiwania literatury.
Więc w żadnej szczególnej kolejności:
1) Czym dokładnie jest „ukryty model procesu”?
Wydawało mi się, że „ukryty model procesu” jest rodzajem pojęcia parasolowego, którego można użyć do opisania szeregu różnych typów modeli statystycznych, wszystkie zasadniczo probabilistyczne opisy danych szeregów czasowych generowanych przez „system nakładania się, potencjalnie ukryte, liniowo addytywne procesy ”([1]). Rzeczywiście [2] definiuje „ukryty model procesu” jako „ogólny termin odnoszący się albo do modelu przestrzeni stanów, albo do ukrytego modelu Markowa”. [1] wydaje się wnioskować, że ukryty model Markowa jest podtypem ukrytych modeli procesów specjalnie ukierunkowanych na wnioskowanie na temat stanów binarnych; podstawowa implikacja wydaje mi się, że ukryty model procesu jest uogólnieniem ukrytego modelu Markowa. Czasami widzę „model ukrytego procesu” ORAZ wyrażenie „
Czy ta intuicja z mojej strony jest poprawna? Jeśli nie, to czy ktoś ma odniesienie, które jaśniej określa te metody?
2) Jaka jest różnica między ukrytym modelem Markowa a modelem przestrzeni stanów?
Wracając ponownie do [2] (choćby dlatego, że artykuł zawiera jasny słownik terminów, a nie dlatego, że sam artykuł wydaje się szczególnie autorytatywny; jest po prostu wygodnym źródłem definicji w jednym zdaniu), różnica wydaje się polegać na tym, że ukryty model Markowa jest szczególnym typem modelu przestrzeni stanów, w którym stany są markowskie (wydaje się, że nie ma wyraźnego ograniczenia kolejności procesu Markowa; tj. pierwszego rzędu, ..., k-tego rzędu). Tutaj model przestrzeni stanów jest zdefiniowany jako „Model, który działa równolegle dwa szeregi czasowe, jeden przechwytuje dynamikę stanów prawdziwych (utajonych), a drugi składa się z obserwacji, które są dokonywane na podstawie tych leżących u podstaw, ale być może nieznanych stanów”. Jeśli te stany wykazują również właściwość Markowa, to jest to Ukryty model Markowa.
Jednak [3] definiuje różnicę między modelami w przestrzeni stanów i ukrytymi modelami Markowa jako związaną z charakterystyką stanu utajonego. Tutaj ukryty model Markowa zajmuje się stanami dyskretnymi, podczas gdy modele przestrzeni stanów zajmują się stanami ciągłymi; w przeciwnym razie są one koncepcyjnie identyczne.
Wydaje mi się, że są to dwie bardzo różne definicje. Pod jednym z nich ukryty model Markowa jest podtypem modelu przestrzeni stanów, podczas gdy pod drugim oba są po prostu różnymi instancjami szerszej klasy ukrytych modeli procesów. Który z nich jest poprawny? Moja intuicja sugeruje, że podążam za [3] w przeciwieństwie do [2], ale nie mogę znaleźć wiarygodnego źródła, które to popiera.
3) Co to jest „model przejściowy Markowa”?
Innym terminem, który pojawił się w wielu źródłach, jest „model przejściowy Markowa”. Nie udało mi się znaleźć tego wyrażenia w żadnym podręczniku, ale często pojawia się w artykułach w czasopismach (wystarczy podłączyć go do Google, aby potwierdzić). Nie byłem w stanie znaleźć ścisłej definicji tego terminu (każdy znaleziony przeze mnie artykuł przytacza inny artykuł, który cytuje inny, itp., Wysyłając mnie do króliczej nory PubMed, która nie prowadzi do zdrowego rozsądku). Mam wrażenie z kontekstu, że jest to bardzo ogólny termin odnoszący się do dowolnego modelu, w którym przedmiotem wnioskowania są przejścia między stanami, które następują po procesie Markowa, i że Ukryty model Markowa można uznać za szczególny typ modelu przejściowego Markowa . [4] wydaje się jednak używać zamiennie modelu przejściowego, ukrytego modelu Markowa i kilku podobnych terminów.
Z drugiej strony [5] mówi o modelach przejściowych Markowa i ukrytych modelach Markowa nieco inaczej. Autorzy stwierdzają: „Modele przejścia zapewniają metodę podsumowywania dynamiki respondentów, która jest pomocna w interpretacji wyników z bardziej złożonych ukrytych modeli Markowa”. Nie do końca rozumiem, co rozumieją przez to wyrażenie i nie mogę znaleźć uzasadnienia w innym miejscu tego dokumentu. Wydaje się jednak sugerować, że modele przejściowe Markowa wykorzystują czas jako zmienną ciągłą, podczas gdy ukryte modele Markowa wykorzystują czas jako zmienną dyskretną (nie mówią tego wprost; twierdzą, że używają pakietu R msm do dopasowania przejścia Markowa modele, a później opisują „msm” jako ciągłe traktowanie czasu w przeciwieństwie do pakietu R dla HMM).
4) Gdzie pasują inne koncepcje, na przykład dynamiczne sieci bayesowskie?
Według Wikipedii Dynamic Bayesian Network to „uogólnienie ukrytych modeli Markowa i filtrów Kalmana”. Gdzie indziej widziałem ukryte modele Markowa zdefiniowane jako szczególny przypadek dynamicznej sieci bayesowskiej, „która cały stan świata jest reprezentowany przez jedną zmienną stanu ukrytego” ( Definicja dynamicznego systemu bayesowskiego i jego związek z HMM? ) . Zasadniczo rozumiem ten związek i dobrze to wyjaśnia [6].
Trudno mi jednak zrozumieć, w jaki sposób ta relacja pasuje do szerszego obrazu rzeczy. To znaczy, biorąc pod uwagę tę relację między HMM a DBN, w jaki sposób modele przestrzeni stanów i modele procesów ukrytych są powiązane z tymi dwoma? Jak te wszystkie różne metody są ze sobą powiązane, skoro wydaje się, że istnieje wiele „uogólnień” ukrytych modeli Markowa?
Bibliografia:
[1] Tom M. Mitchell, Rebecca Hutchinson, Indrayana Rustandi. „Ukryte modele procesów”. 2006. CMU-CALD-05-116. Carnegie Mellon University.
[2] Oliver Giminez, Jean-Dominique Lebreton, Jean-Michel Gaillard, Remi Choquet, Roger Pradel. „Szacowanie parametrów demograficznych przy użyciu modeli dynamicznych procesów ukrytych”. Teoretyczna populacja biologii. 2012. 82 (4): 307-316.
[3] Barbara Engelhardt. „Ukryte modele Markowa i modele przestrzeni państwowej”. STA561: Probabilistyczne uczenie maszynowe. Uniwersytet Duke'a. http://www.genome.duke.edu/labs/engelhardt/courses/scribe/lec_09_25_2013.pdf
[4] Jeroen K. Vermunt. „Wielopoziomowe utajone modelowanie Markowa w ciągłym czasie z zastosowaniem do analizy danych oceny nastroju ambulatoryjnego”. Warsztat statystyki społecznej. 2012. Uniwersytet Tilburg. http://www.lse.ac.uk/statistics/events/SpecialEventsandConferences/LSE2013-Vermunt.pdf
[5] Ken Richardson, David Harte, Kristie Carter. „Zrozumienie przejścia na zdrowie i siłę roboczą: zastosowanie modeli Markowa do danych podłużnych SoFIE”. Oficjalna seria badań statystycznych. 2012.
[6] Zoubin Ghahramani. „Wprowadzenie do ukrytych modeli Markowa i sieci bayesowskich”. Journal of Pattern Recognition and Artificial Intelligence. 2001. 15 (1): 9–42.