Przedmówię to stwierdzeniem, że nie zawsze jest jasne, co należy rozumieć przez „nieparametryczny” lub „półparametryczny” itp. W komentarzach wydaje się prawdopodobne, że whuber ma na myśli jakąś formalną definicję (może coś w rodzaju wyboru modelu z jakiejś rodziny { M θ : θ ∈ Θ } gdzie ΘMθ{Mθ:θ∈Θ}Θ ma nieskończone wymiary), ale będę dość nieformalny. Niektórzy mogą argumentować, że metoda nieparametryczna to taka, w której efektywna liczba używanych parametrów rośnie wraz z danymi. Myślę, że na stronie videolectures.net znajduje się wideo, na którym (jak sądzę) Peter Orbanz podaje cztery lub pięć różnych ujęć tego, jak możemy zdefiniować „nieparametryczny”.
Ponieważ myślę, że wiem, jakie rzeczy masz na myśli, dla uproszczenia założę, że mówisz o używaniu procesów Gaussa do regresji, w typowy sposób: mamy dane treningowe jesteśmy zainteresowani modelowaniem średniej warunkowej E ( Y | X = x ) : = f ( x ) . Piszemy
Y i = f ( X i(Yi,Xi),i=1,...,nE(Y|X=x):=f(x)będzie jednowymiarowy, ale wszystko przeniesie się na wyższe wymiary.
i być może jesteśmy tak odważni, że zakładamy, że ϵ i są iid i normalnie rozłożone, ϵ i ∼ N ( 0 , σ 2 ) . X i
Yi=f(Xi)+ϵi
ϵiϵi∼N(0,σ2)Xi
Jeśli nasz może przyjmować wartości w kontinuum, to f ( ⋅ ) może być uważane za parametr (niepoliczalnie) nieskończonego wymiaru. W tym sensie, że szacujemy parametr nieskończonego wymiaruXif(⋅) , nasz problem jest nieparametryczny. To prawda, że podejście bayesowskie ma pewne parametry unoszące się tu i tam. Ale tak naprawdę nazywa się to nieparametrycznym, ponieważ szacujemy coś o nieskończonym wymiarze. Priory GP, których używamy, przypisują masę do każdego sąsiedztwa każdej funkcji ciągłej, aby mogli dowolnie oszacować dowolną funkcję ciągłą.
Rzeczy w funkcji kowariancji odgrywają rolę podobną do parametrów wygładzania w zwykły - częstościowym estymatorów, aby problem się nie być absolutnie beznadziejna musimy założyć, że istnieje pewna struktura, że możemy spodziewać się wystawowa. Bayesianie dokonują tego, stosując przeor na przestrzeni funkcji ciągłych w postaci procesu Gaussa. Z perspektywy bayesowskiej kodujemy przekonania na temat f , zakładając, że f pochodzi od lekarza ogólnego z taką lub inną funkcją kowariancji. Wcześniej skutecznie karze oszacowania f za zbyt skomplikowane.ffff
Edycja dla problemów obliczeniowych
Większość (wszystkich?) Tych rzeczy znajduje się w książce Gaussian Process autorstwa Rasmussena i Williamsa.
O(N2)O(N3)v(K+σ2I)v=YKO(N3)kO(kN2)K
O(N3)O(kN2)Nmm×mYNmO(m2N)
KK=QQTQn×qqK+σ2IQTQ+σ2I