Podczas gdy faktycznie programowałem na maszynach Boltzmanna na zajęciach z fizyki, nie znam ich teoretycznej charakterystyki. W przeciwieństwie do tego znam skromną wiedzę na temat teorii modeli graficznych (o kilku pierwszych rozdziałach książki Lauritzen Modele graficzne ).
Pytanie: Czy istnieje jakiś znaczący związek między modelami graficznymi a maszyną Boltzmanna? Czy maszyna Boltzmanna jest rodzajem modelu graficznego?
Oczywiście maszyna Boltzmanna jest rodzajem sieci neuronowej. Słyszałem, że niektóre sieci neuronowe są matematycznie powiązane z modelami graficznymi, a niektóre nie.
Powiązane pytania dotyczące CrossValidated, które nie odpowiadają na moje pytanie:
Jest to podobne do poprzedniego pytania, które zostało zadane wcześniej: Jaki jest związek między modelami hierarchicznymi, sieciami neuronowymi, modelami graficznymi, sieciami bayesowskimi? ale jest bardziej szczegółowy.
Co więcej, zaakceptowana odpowiedź na to pytanie nie wyjaśnia mojego zamieszania - nawet jeśli węzły w standardowej graficznej reprezentacji sieci neuronowej nie reprezentują zmiennych losowych, to niekoniecznie oznacza, że taka reprezentacja nie istnieje. Konkretnie mam na myśli o tym, jak węzły w typowej graficznej reprezentacji łańcuchów Markowa reprezentuje zbiór możliwych stanów zamiast zmienne losowe , ale można też utworzyć wykres przedstawiający warunkowe relacje zależności między X I, co pokazuje, że każdy łańcuch Markowa jest w rzeczywistości losowym polem Markowa. Odpowiedź mówi również, że sieci neuronowe (przypuszczalnie obejmujące maszyny Boltzmanna) są „dyskryminujące”, ale nie wnikają bardziej szczegółowo w wyjaśnienie, co oznacza to twierdzenie, ani też oczywiste pytanie uzupełniające „czy modele graficzne nie są dyskryminujące?” zaadresowany. Podobnie, zaakceptowana odpowiedź prowadzi do strony Kevina Murphy'ego (faktycznie czytam niektóre z jego rozpraw doktorskich, kiedy dowiaduję się o sieci bayesowskie), ale ta strona internetowa omawia tylko sieci bayesowskie i wcale nie wspomina o sieciach neuronowych - dlatego też nie wyjaśnia, w jaki sposób są różne.
To drugie pytanie jest prawdopodobnie najbardziej podobne do mojego: Modelowanie matematyczne sieci neuronowych jako modeli graficznych Jednak żadna z odpowiedzi nie została zaakceptowana i podobnie podaje tylko referencje, ale nie wyjaśniają referencji (np. Ta odpowiedź ). Mam nadzieję, że pewnego dnia będę w stanie zrozumieć odniesienia, ale teraz jestem na podstawowym poziomie wiedzy i najbardziej doceniłbym odpowiedź, która jest tak uproszczona, jak to możliwe. Również kurs w Toronto, do którego link znajduje się w górnej odpowiedzi ( http://www.cs.toronto.edu/~tijmen/csc321/lecture_notes.shtml ), rozwiązuje ten problem, ale nie jest zbyt szczegółowy. Ponadto notatki do jednego wykładu, które mogłyby odpowiedzieć na moje pytanie, nie są publicznie dostępne.
25 marca Wykład 13b: Sieci wierzeń 7:43. Na tym slajdzie pamiętaj o maszynach Boltzmann. Tam też mamy ukryte jednostki i widoczne jednostki, i to wszystko jest probabilistyczne. BM i SBN mają więcej wspólnego niż różnice. 9:16. W dzisiejszych czasach „modele graficzne” są czasem uważane za specjalną kategorię sieci neuronowych, ale w opisanej tutaj historii były one uważane za bardzo różne typy systemów.