Kontekst: SysID i kontroluje faceta, który dostał się do ML.
Myślę, że odpowiedź user110686 dobrze wyjaśnia niektóre różnice. SysID z konieczności dotyczy modeli dynamicznych z danych wejściowych / wyjściowych, podczas gdy ML obejmuje szerszą klasę problemów. Ale największą różnicą, jaką widzę, jest związek z (a) pamięcią (liczbą parametrów); (b) końcowe zastosowanie modelu „wyuczonego”. Identyfikacja systemu jest w dużej mierze podejściem przetwarzania sygnałów, biorąc pod uwagę reprezentacje w dziedzinie częstotliwości, analizę czasowo-częstotliwościową itp. Niektórzy ludzie ML nazywają to „inżynierią cech”.
(pamięć:SysID stał się widoczny na długo przed pojawieniem się ML jako dziedziny badań. Stąd statystyki i przetwarzanie sygnałów były podstawową podstawą teoretycznych podstaw, a obliczenia były przerażające. Dlatego ludzie pracowali z bardzo prostą klasą modeli (kompromis Bias-Wariancja) o bardzo niewielu parametrach. Mówimy co najwyżej 30–40 parametrów i głównie modele liniowe, nawet w przypadkach, gdy ludzie wyraźnie wiedzą, że problem jest nieliniowy. Jednak teraz obliczenia są bardzo tanie, ale SysID jeszcze nie wyszedł z powłoki. Ludzie powinni zacząć zdawać sobie sprawę, że mamy teraz znacznie lepsze czujniki, mogą z łatwością oszacować 1000 parametrów za pomocą bardzo bogatych zestawów modeli. Niektórzy badacze próbowali wykorzystać sieci neuronowe dla SysID, ale wielu niechętnie przyjmuje je jako „główny nurt”, ponieważ nie ma wielu teoretycznych gwarancji.
(b) Ostateczne zastosowanie wyuczonego modelu: Teraz jest to jedna rzecz, którą SysID uzyskał bardzo poprawnie, ale wiele algorytmów ML nie wychwytuje. Ważne jest, aby zdawać sobie sprawę, że dla aplikacji docelowych koniecznie budujesz modele, które można skutecznie wykorzystać do optymalizacji online.Modele te zostaną wykorzystane do propagowania wszelkich podjętych decyzji dotyczących kontroli, a gdy zostanie to ustawione jako optymalny problem kontroli, modele staną się ograniczeniami. Tak więc przy użyciu niezwykle skomplikowanej struktury modelu znacznie utrudnia to optymalizację online. Należy również pamiętać, że te decyzje online są podejmowane w skali sekund lub mniejszej. Alternatywą jest bezpośrednie poznanie funkcji wartości w sposób niezgodny z polityką w celu uzyskania optymalnej kontroli. Jest to w zasadzie nauka wzmacniająca i myślę, że istnieje dobra synergia między SysID i RL.