Jakie jest uzasadnienie funkcji kowariancji Matérna?


19

Funkcja kowariancji Matérna jest powszechnie stosowana jako funkcja jądra w procesie Gaussa. Jest tak zdefiniowane

Cν(d)=σ221νΓ(ν)(2νdρ)νKν(2νdρ)

gdzie jest funkcją odległości (taką jak odległość euklidesowa), jest funkcją gamma, jest zmodyfikowaną funkcją Bessela drugiego rodzaju, i są parametrami dodatnimi. to dużo czasu, aby wybrać w praktyce lub .dΓKνρνν3252

Dużo czasu to jądro działa lepiej niż standardowe jądro Gaussa, ponieważ jest „mniej gładkie”, ale poza tym, czy jest jakiś inny powód, dla którego wolimy to jądro? Doceniona zostanie pewna geometryczna intuicja dotycząca jej zachowania lub wyjaśnienie pozornie tajemniczej formuły.

Odpowiedzi:


18

Oprócz ładnej odpowiedzi @DahnJahn, pomyślałem, że spróbuję powiedzieć coś więcej o pochodzeniu funkcji Bessela i gamma. Jednym z punktów wyjścia do dojścia do funkcji kowariancji jest twierdzenie Bochnera.

Twierdzenie (Bochner) Ciągła funkcja stacjonarna jest dodatnio określona tylko i tylko wtedy, gdy ˜ k jest transformatą Fouriera skończonej miary dodatniej: k(x,y)=k~(|xy|)k~

k~(t)=Reiωtdµ(ω)

Z tego można wywnioskować, że macierz kowariancji Matérna wyprowadza się jako transformatę Fouriera (źródło) . To wszystko dobrze, ale tak naprawdę nie mówi nam, jak dojść do tej skończonej pozytywnej miary podanej przez . Cóż, to jest gęstość widmowa (mocy) procesu stochastycznego . 11(1+ω2)p f(x)1(1+ω2)pf(x)

Który proces stochastyczny? Wiadomo, że losowy proces na funkcją kowariancji Matérna jest rozwiązaniem stochastycznego równania różniczkowego cząstkowego (SPDE) gdzie to biały szum Gaussa z wariancją jednostkową, jest operatorem Laplace'a, i (Myślę, że jest to w Cressie i Wikle ). ( κ 2 - ) α / 2 X(s)= φ W(s),W(s)Δ= d i = 1 2Rd

(κ2)α/2X(s)=φW(s),
W(s) α=ν+d/2
Δ=ja=1re2)xja2)
α=ν+re/2)

Po co wybierać ten konkretny proces SPDE / stochastyczny? Pochodzenie znajduje się w statystykach przestrzennych, gdzie twierdzi się, że jest to najprostsza i naturalna kowariancja, która działa dobrze w :R2)

Funkcja korelacji wykładniczej jest naturalną korelacją w jednym wymiarze, ponieważ odpowiada procesowi Markowa. W dwóch wymiarach już tak nie jest, chociaż wykładnicza jest częstą funkcją korelacji w pracach geostatystycznych. Whittle (1954) ustalił korelację odpowiadającą stochastycznemu równaniu różniczkowemu typu Laplace'a:

ϵ

[(t1)2)+(t2))2)-κ2)]X(t1,t2))=ϵ(t1,t2))
gdzie to biały szum. Odpowiednim dyskretnym procesem sieci jest autoregresja drugiego rzędu. (Źródło)ϵ

Rodzina procesów zawartych w SDE związanych z równaniem Materna obejmuje model Ornsteina-Uhlenbecka prędkości cząstki podlegającej ruchowi Browna. Mówiąc bardziej ogólnie, można zdefiniować spektrum mocy dla rodziny procesów dla każdej liczby całkowitej która również ma kowariancję rodziny Matérn. Jest to w załączniku Rasmussen i Williams.A R ( p ) pZAR(1)ZAR(p)p

Ta funkcja kowariancji nie jest związana z procesem klastrowania Matérna.

Bibliografia

Cressie, Noel i Christopher K. Wikle. Statystyka danych czasoprzestrzennych. John Wiley & Sons, 2015.

Guttorp, Peter i Tilmann Gneiting. „Badania w historii prawdopodobieństwa i statystyki XLIX O rodzinie korelacji Matern”. Biometrika 93.4 (2006): 989–995.

Rasmussen, CE i Williams, CKI Gaussian Processes for Machine Learning. the MIT Press, 2006.


2
W przypadku jednowymiarowym kowariancja Materna o kształcie z dodatnią liczbą całkowitą jest procesem procesu autoregresji w czasie ciągłym rzędu . Jednak nie wszystkie modele mają kowariancję matern. s CAR ( p ) P CAR ( s )ν=p-1/2)pSAMOCHÓD(p)pSAMOCHÓD(p)
Yves

To oczywiste nieporozumienie z mojej strony, zaktualizuję odpowiedź. Dziękuję Ci!
MachineEpsilon

16

Nie wiem, ale uznałem to pytanie za bardzo interesujące i oto, co otrzymałem po lekturze na ten temat.

Dla niektórych wartości funkcję kowariancji Matérna można wyrazić jako iloczyn wykładniczej i wielomianu. Np. Dla : Nie jest więc zaskakujące, że skoro , faktycznie zbiega się do gaussowskiego RBF : Dla , funkcja kowariancji Matérna daje absolutne wykładnicze jądro νν=5/2)

do5/2)(re)=σ2)(1+5reρ+5re2)3)ρ2))exp(-5reρ)
νdoν
limνdoν(re)=σ2)exp(-re2)2)ρ2))
ν=1/2)
do1/2)(re)=σ2)exp(-reρ)

Co więcej, proces Gaussa z funkcją kowariancji Matérna z parametrem jest - czas różniczkowalny .νν-1

Jest to całkiem ładnie przedstawione na zdjęciu wykonanym przez Rasmussen i Williams (2006) CE Rasmussen & CKI Williams, Gaussian Processes for Machine Learning, MIT Press, 2006, ISBN 026218253X.  c 2006 Massachusetts Institute of Technology.  www.GaussianProcess.org/gpml

W Interpolacji danych przestrzennych Stein (który faktycznie zaproponował nazwę funkcji kowariancji Matérna), twierdzi (str. 30), że nieskończona różnorodność funkcji kowariancji Gaussa daje nierealistyczne wyniki dla procesów fizycznych, ponieważ obserwuje tylko niewielki ciągły ułamek czasoprzestrzeń powinna teoretycznie dać całą funkcję. W ten sposób zaproponował wersję Matérn jako uogólnienie, które jest w stanie bardziej realistycznie dopasować procesy fizyczne.

streszczenie

Funkcję kowariancji Matérna można postrzegać jako uogólnienie radialnej funkcji bazowej Gaussa . Zawiera nawet absolutne jądro wykładnicze, co daje radykalnie różne wyniki i jest w stanie lepiej wychwytywać procesy fizyczne ze względu na jego skończoną różnorodność (dla skończonego ).ν

Jeśli chodzi o tajemniczość pojawienia się funkcji Bessela, chciałbym zobaczyć za tym dalszą intuicję, ale zgaduję, że to właśnie jej (asymptotyczne) zachowanie w sprawiło, że było przydatne w tym kontekście i doprowadziło Steina do zdefiniuj funkcję kowariancji Matérna. To oczywiście nie wyklucza, że ​​istnieje piękny argument, dlaczego wszystko to jest prawdą.ν


1
(+1) Byłem ciekawy, czy istnieje wyjaśnienie lub wyprowadzenie tej funkcji kowariancji w książce Matérn pub.epsilon.slu.se/10033/1/... ? Jak dotąd nie udało mi się go zlokalizować. Wydaje się, że ta funkcja kowariancji zajmuje bardzo ważne miejsce w książce Steina, więc chcę wiedzieć więcej.
MachineEpsilon

@Machineepsilon czy Matérn faktycznie wspomina / definiuje funkcję? Z książki Steina mam wrażenie, że to on ją wymyślił i nazwał ją tylko Matérn.
Dahn

Nie jestem pewien, tego właśnie chciałem się dowiedzieć! Spróbuję rzucić okiem, ponieważ Rasmussen także odwołuje się do książki.
MachineEpsilon
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.