Ukryty model Markowa kontra model przejściowy Markowa vs model państwowej przestrzeni…?

W ramach mojej pracy magisterskiej pracuję nad opracowaniem modelu statystycznego dla przejść między różnymi stanami, określonego statusem serologicznym. Na razie nie podam zbyt wielu szczegółów w tym kontekście, ponieważ moje pytanie jest bardziej ogólne / teoretyczne. W każdym razie, mam intuicję, że powinienem używać ukrytego modelu Markowa (HMM); Problemem, który napotykam, gdy przeglądam literaturę i inne badania podstawowe niezbędne do sformułowania mojego modelu, jest zamieszanie w terminologii i dokładne różnice między różnymi typami ukrytych modeli procesów. Jestem bardzo niejasno świadomy tego, co je wyróżnia (przykłady, które nadchodzą). Ponadto wydaje mi się, że przynajmniej z tego, co widziałem w literaturze, istnieje bardzo niestandardowe słownictwo zbudowane wokół tego rodzaju modelowania,

Miałem więc nadzieję, że ludzie pomogą mi ujednoznacznić niektóre z tych warunków. Mam wiele pytań, ale domyślam się, że gdy jedno lub dwa zostaną zadowalająco odpowiedziane, reszta zostanie w rezultacie rozplątana. Mam nadzieję, że to nie jest zbyt rozwlekłe; jeśli moderator chce, żebym podzielił to na wiele postów, zrobię to. W każdym razie pogrubiłem moje pytania, a następnie szczegółowo pytanie, które odkryłem podczas przeszukiwania literatury.

Więc w żadnej szczególnej kolejności:

1) Czym dokładnie jest „ukryty model procesu”?

Wydawało mi się, że „ukryty model procesu” jest rodzajem pojęcia parasolowego, którego można użyć do opisania szeregu różnych typów modeli statystycznych, wszystkie zasadniczo probabilistyczne opisy danych szeregów czasowych generowanych przez „system nakładania się, potencjalnie ukryte, liniowo addytywne procesy ”([1]). Rzeczywiście [2] definiuje „ukryty model procesu” jako „ogólny termin odnoszący się albo do modelu przestrzeni stanów, albo do ukrytego modelu Markowa”. [1] wydaje się wnioskować, że ukryty model Markowa jest podtypem ukrytych modeli procesów specjalnie ukierunkowanych na wnioskowanie na temat stanów binarnych; podstawowa implikacja wydaje mi się, że ukryty model procesu jest uogólnieniem ukrytego modelu Markowa. Czasami widzę „model ukrytego procesu” ORAZ wyrażenie „

Czy ta intuicja z mojej strony jest poprawna? Jeśli nie, to czy ktoś ma odniesienie, które jaśniej określa te metody?

2) Jaka jest różnica między ukrytym modelem Markowa a modelem przestrzeni stanów?

Wracając ponownie do [2] (choćby dlatego, że artykuł zawiera jasny słownik terminów, a nie dlatego, że sam artykuł wydaje się szczególnie autorytatywny; jest po prostu wygodnym źródłem definicji w jednym zdaniu), różnica wydaje się polegać na tym, że ukryty model Markowa jest szczególnym typem modelu przestrzeni stanów, w którym stany są markowskie (wydaje się, że nie ma wyraźnego ograniczenia kolejności procesu Markowa; tj. pierwszego rzędu, ..., k-tego rzędu). Tutaj model przestrzeni stanów jest zdefiniowany jako „Model, który działa równolegle dwa szeregi czasowe, jeden przechwytuje dynamikę stanów prawdziwych (utajonych), a drugi składa się z obserwacji, które są dokonywane na podstawie tych leżących u podstaw, ale być może nieznanych stanów”. Jeśli te stany wykazują również właściwość Markowa, to jest to Ukryty model Markowa.

Jednak [3] definiuje różnicę między modelami w przestrzeni stanów i ukrytymi modelami Markowa jako związaną z charakterystyką stanu utajonego. Tutaj ukryty model Markowa zajmuje się stanami dyskretnymi, podczas gdy modele przestrzeni stanów zajmują się stanami ciągłymi; w przeciwnym razie są one koncepcyjnie identyczne.

Wydaje mi się, że są to dwie bardzo różne definicje. Pod jednym z nich ukryty model Markowa jest podtypem modelu przestrzeni stanów, podczas gdy pod drugim oba są po prostu różnymi instancjami szerszej klasy ukrytych modeli procesów. Który z nich jest poprawny? Moja intuicja sugeruje, że podążam za [3] w przeciwieństwie do [2], ale nie mogę znaleźć wiarygodnego źródła, które to popiera.

3) Co to jest „model przejściowy Markowa”?

Innym terminem, który pojawił się w wielu źródłach, jest „model przejściowy Markowa”. Nie udało mi się znaleźć tego wyrażenia w żadnym podręczniku, ale często pojawia się w artykułach w czasopismach (wystarczy podłączyć go do Google, aby potwierdzić). Nie byłem w stanie znaleźć ścisłej definicji tego terminu (każdy znaleziony przeze mnie artykuł przytacza inny artykuł, który cytuje inny, itp., Wysyłając mnie do króliczej nory PubMed, która nie prowadzi do zdrowego rozsądku). Mam wrażenie z kontekstu, że jest to bardzo ogólny termin odnoszący się do dowolnego modelu, w którym przedmiotem wnioskowania są przejścia między stanami, które następują po procesie Markowa, i że Ukryty model Markowa można uznać za szczególny typ modelu przejściowego Markowa . [4] wydaje się jednak używać zamiennie modelu przejściowego, ukrytego modelu Markowa i kilku podobnych terminów.

Z drugiej strony [5] mówi o modelach przejściowych Markowa i ukrytych modelach Markowa nieco inaczej. Autorzy stwierdzają: „Modele przejścia zapewniają metodę podsumowywania dynamiki respondentów, która jest pomocna w interpretacji wyników z bardziej złożonych ukrytych modeli Markowa”. Nie do końca rozumiem, co rozumieją przez to wyrażenie i nie mogę znaleźć uzasadnienia w innym miejscu tego dokumentu. Wydaje się jednak sugerować, że modele przejściowe Markowa wykorzystują czas jako zmienną ciągłą, podczas gdy ukryte modele Markowa wykorzystują czas jako zmienną dyskretną (nie mówią tego wprost; twierdzą, że używają pakietu R msm do dopasowania przejścia Markowa modele, a później opisują „msm” jako ciągłe traktowanie czasu w przeciwieństwie do pakietu R dla HMM).

4) Gdzie pasują inne koncepcje, na przykład dynamiczne sieci bayesowskie?

Według Wikipedii Dynamic Bayesian Network to „uogólnienie ukrytych modeli Markowa i filtrów Kalmana”. Gdzie indziej widziałem ukryte modele Markowa zdefiniowane jako szczególny przypadek dynamicznej sieci bayesowskiej, „która cały stan świata jest reprezentowany przez jedną zmienną stanu ukrytego” ( Definicja dynamicznego systemu bayesowskiego i jego związek z HMM? ) . Zasadniczo rozumiem ten związek i dobrze to wyjaśnia [6].

Trudno mi jednak zrozumieć, w jaki sposób ta relacja pasuje do szerszego obrazu rzeczy. To znaczy, biorąc pod uwagę tę relację między HMM a DBN, w jaki sposób modele przestrzeni stanów i modele procesów ukrytych są powiązane z tymi dwoma? Jak te wszystkie różne metody są ze sobą powiązane, skoro wydaje się, że istnieje wiele „uogólnień” ukrytych modeli Markowa?

Bibliografia:

[1] Tom M. Mitchell, Rebecca Hutchinson, Indrayana Rustandi. „Ukryte modele procesów”. 2006. CMU-CALD-05-116. Carnegie Mellon University.

[2] Oliver Giminez, Jean-Dominique Lebreton, Jean-Michel Gaillard, Remi Choquet, Roger Pradel. „Szacowanie parametrów demograficznych przy użyciu modeli dynamicznych procesów ukrytych”. Teoretyczna populacja biologii. 2012. 82 (4): 307-316.

[3] Barbara Engelhardt. „Ukryte modele Markowa i modele przestrzeni państwowej”. STA561: Probabilistyczne uczenie maszynowe. Uniwersytet Duke'a. http://www.genome.duke.edu/labs/engelhardt/courses/scribe/lec_09_25_2013.pdf

[4] Jeroen K. Vermunt. „Wielopoziomowe utajone modelowanie Markowa w ciągłym czasie z zastosowaniem do analizy danych oceny nastroju ambulatoryjnego”. Warsztat statystyki społecznej. 2012. Uniwersytet Tilburg. http://www.lse.ac.uk/statistics/events/SpecialEventsandConferences/LSE2013-Vermunt.pdf

[5] Ken Richardson, David Harte, Kristie Carter. „Zrozumienie przejścia na zdrowie i siłę roboczą: zastosowanie modeli Markowa do danych podłużnych SoFIE”. Oficjalna seria badań statystycznych. 2012.

[6] Zoubin Ghahramani. „Wprowadzenie do ukrytych modeli Markowa i sieci bayesowskich”. Journal of Pattern Recognition and Artificial Intelligence. 2001. 15 (1): 9–42.

machine-learning self-study hidden-markov-model

— Ryan Simmons
źródło

Możesz także wypróbować Recurrent Neural Network. W rozpoznawaniu mowy niektóre z nich z powodzeniem wykorzystują je jako zamiennik HMM.

— Albert

Dziękuję za sugestię. W tej chwili wolę wyjaśnić moje pytania na temat tych technik, zanim przejdę do studiowania nowych.

— Ryan Simmons,

Odnoszą się do tej samej rzeczy. Proszę zobaczyć scholarpedia.org/article/State_space_model Sangdon

@Ryan Simmons Myślę, że dobrym pomysłem byłoby sprawdzenie filmów Mathematicalmonk (aka Jeffrey Miller) na temat łańcuchów Markova i ukrytych modeli Markova na youtube.

— JimBoy

Skoro prawdopodobnie już złożyłeś pracę, czy zechciałbyś sam odpowiedzieć na to pytanie? Na przykład chciałbym, aby eksperci odpowiedzieli tutaj, co prawdopodobnie dotyczy również prawie 800 innych osób, które czytają to pytanie.

— Ulf Aslak

Poniżej cytowany ze strony Scholarpedia :

Model przestrzeni stanów (SSM) odnosi się do klasy probabilistycznego modelu graficznego (Koller i Friedman, 2009), który opisuje zależność probabilistyczną między zmienną stanu utajonego a obserwowanym pomiarem. Stan lub pomiar może być ciągły lub dyskretny. Termin „przestrzeń państwowa” powstał w latach 60. XX wieku w dziedzinie inżynierii sterowania (Kalman, 1960). SSM zapewnia ogólne ramy do analizy deterministycznych i stochastycznych układów dynamicznych, które są mierzone lub obserwowane w procesie stochastycznym. Struktura SSM została z powodzeniem zastosowana w inżynierii, statystyce, informatyce i ekonomii w celu rozwiązania szerokiego zakresu problemów z układami dynamicznymi. Inne terminy używane do opisu SSM to ukryte modele Markowa (HMM) (Rabiner, 1989) i modele procesów utajonych. Najlepiej zbadanym SSM jest filtr Kalmana,

— użytkownik93693
źródło

Ja i Alan Hawkes sporo pisaliśmy o zagregowanych procesach Markowa z dyskretnymi stanami w ciągłym czasie. Nasze prace dotyczyły problemu interpretacji obserwacji cząsteczek pojedynczego kanału jonowego i obejmują dokładne leczenie pominiętych krótkich zdarzeń. Podobna teoria działa również w teorii niezawodności. Może być dobrze przystosowany do innych problemów. Zobacz: http://www.onemol.org.uk/?page_id=175 dla odniesienia.

— David Colquhoun
źródło