Główne zalety modeli procesów Gaussa

Proces Gaussa był szeroko stosowany, szczególnie w emulacji. Wiadomo, że zapotrzebowanie obliczeniowe jest wysokie ( ). $0(n^3)$

Co czyni je popularnymi?
Jakie są ich główne i ukryte zalety?
Dlaczego stosuje się je zamiast modeli parametrycznych (przez model parametryczny mam na myśli typową regresję liniową, w której można zastosować różne formy parametryczne do opisania trendu wejściowego vs wyjściowego; np. Qaudratic)?

Byłbym naprawdę wdzięczny za odpowiedź techniczną wyjaśniającą nieodłączne właściwości, które sprawiają, że proces Gaussa jest wyjątkowy i korzystny

gaussian-process

— Wis
źródło

Czy możesz wyjaśnić, co masz na myśli przez modele parametryczne?

— Aleksiej Zajcew

@Alexey Wyjaśniłem powyżej, co mam na myśli przez model paramtryczny. Dziękuję

— Wis

Z tego, co zakładam na temat modeli parametrycznych, musisz określić model ręcznie dla każdego problemu. Nie zawsze jest to możliwe, ponieważ prawdziwa natura nie zawsze jest znana. Ponadto mogą wystąpić trudności z dopasowaniem tych modeli, natomiast w przypadku procesów gaussowskich szacowanie parametrów działa dobrze prawie za każdym razem.

— Aleksiej Zajcew

Splajny i regresja liniowa są równoważne regresji procesów Gaussa z wybraną odpowiednią funkcją kowariancji. Ale procesy gaussowskie zapewniają dogodną strukturę probabilistyczną dobrze dopasowaną do wielu zadań.

— Aleksiej Zajcew

Kiedy nie użyłbyś procesu Gaussa?

— Alby

Odpowiedzi:

Główne zalety są z punktu widzenia inżynierii (jak wspomniano @Alexey). W szeroko stosowanej procedurze Kriginga można interpretować własną „przestrzeń”, zapewniając model „korelacji” (lub kowariancji) (zwykle nazywany elipsoidą wariogramu ) dla relacji w zależności od odległości i orientacji.

Nic nie stoi na przeszkodzie, aby inne metodologie miały te same cechy, po prostu zdarzyło się, że sposób, w jaki Kriging został po raz pierwszy konceptualizowany, miał przyjazne podejście do ludzi, którzy nie byli statystykami.

Obecnie wraz ze wzrostem metod stochastycznych opartych na geostatystyce, takich jak między innymi Sequential Gaussian Simulation , procedury te są wykorzystywane w sektorach, w których ważne jest zdefiniowanie przestrzeni niepewności (która może przyjmować tysiące do milionów wymiarów). Ponownie, z inżynierskiego punktu widzenia, algorytmy oparte na geostatystyce są bardzo łatwe do włączenia do programowania genetycznego . Dlatego gdy masz odwrotne problemy , musisz przetestować wiele scenariuszy i przetestować ich zdolność adaptacji do funkcji optymalizacji.

Pozostawmy na chwilę czystą argumentację i podaj fakty dla nowoczesnego prawdziwego przykładu tego zastosowania. Możesz albo próbkować próbki podziemne bezpośrednio (dane twarde), albo wykonać mapę sejsmiczną podpowierzchni (dane miękkie).

W twardych danych można zmierzyć właściwość (powiedzmy impedancję akustyczną) bezpośrednio bez błędu (ish). Problem polega na tym, że jest to rzadkie (i drogie). Z drugiej strony masz mapowanie sejsmiczne, które jest dosłownie przestrzenną, pikselową mapą podpowierzchni, ale nie daje impedancji akustycznej. Dla uproszczenia powiedzmy, że daje stosunek dwóch wartości impedancji akustycznej (góra i dół). Tak więc stosunek 0,5 może być dzieleniem 1000/2000 lub 10 000/20 000. Jest to przestrzeń z wieloma rozwiązaniami i wystarczy kilka kombinacji, ale tylko jedna dokładnie reprezentuje rzeczywistość. Jak to rozwiązujesz?

Sposób działania inwersji sejsmicznej (procedury stochastyczne) polega na tworzeniu prawdopodobnych (i to razem wszystko razem) scenariuszy impedancji akustycznej (lub innych właściwości), przekształcania tych scenariuszy w syntetyczny sejsmiczny (podobnie jak stosunek w poprzednim przykładzie) i porównaj syntetyczny sejsmiczny z rzeczywistym (korelacja). Najlepsze scenariusze zostaną wykorzystane do stworzenia jeszcze większej liczby scenariuszy, które zostaną przekształcone w rozwiązanie (nie jest to tak łatwe, jak się wydaje).

Biorąc to pod uwagę i mówiąc z punktu widzenia użyteczności, odpowiedziałbym na twoje pytania w następujący sposób:

1) To, co sprawia, że są popularne, to użyteczność, elastyczność we wdrażaniu, duża liczba ośrodków badawczych i instytucji, które wciąż opracowują nowsze i bardziej elastyczne procedury oparte na gaussie dla kilku różnych dziedzin (szczególnie w dziedzinie nauk o Ziemi, w tym GIS).

2) Głównymi zaletami są , jak wspomniano wcześniej, użyteczność i elastyczność z mojego punktu widzenia. Jeśli łatwo jest nim manipulować i jest łatwy w użyciu, po prostu zrób to. W procesach gaussowskich nie ma szczególnych cech, których nie można odtworzyć w innych metodologiach (statystycznych lub innych).

3) Są używane, gdy trzeba uwzględnić więcej informacji w swoim modelu niż tylko dane (takie informacje mają relacje przestrzenne, rozkłady statystyczne itd.). Mogę zapewnić, że jeśli masz dużo danych o zachowaniu izotropowym, użycie krigingu jest stratą czasu. Możesz uzyskać te same wyniki przy użyciu dowolnej innej metody, która wymaga mniej informacji, a jej uruchomienie jest szybsze.

— armatita
źródło

A kiedy inny model jest lepszym wyborem?

— Ben

@Ben Zawsze będzie to zależeć od studium przypadku. Kriging lub metody oparte na Kriging mają wysoki koszt obliczeń (więc nie szybko). Na przykład nowoczesne telewizory 4K (lub więcej) używają metod interpolacji, aby spróbować ulepszyć treści stworzone dla mniejszych rozdzielczości. Oznacza to, że musi wykonać tę operację szybko i bez interwencji użytkownika (czego wymagałby model kowariancji). Gdybym miał rozwiązać ten konkretny problem, całkowicie unikałbym Kriginga. Co więcej, niektóre zjawiska są oparte na wzorcach lub mają zmienną dyskretną, lub można je sprowadzić do wzoru (na przykład MES) itp.

— armatita

A kiedy prędkość nie jest ważna?

— Ben

@Ben Speed jest mniej ważny, jeśli wynik nie musi być natychmiastowy. Modelowanie podpowierzchniowe, prognozowanie pogody i szereg operacji w ramach nauk GIS to tylko kilka przykładów. Innym jest ten przedstawiony w odpowiedzi (inwersja sejsmiczna).

— armatita

Przepraszam, nie dostałem tego. Szybkość obliczeń nie ma znaczenia, jakie są wady lekarza ogólnego? Innymi słowy: czy nie należy go stosować znacznie częściej?

— Ben

Dla inżynierów ważne jest:

mieć przedziały ufności dla prognoz
interpolować dane treningowe
mieć gładkie i nieliniowe modele
wykorzystać uzyskane modele regresji do adaptacyjnego projektowania eksperymentów i optymalizacji

Procesy gaussowskie spełniają wszystkie te wymagania.

Ponadto często zestawy danych inżynieryjnych i geostatystycznych nie są tak duże lub mają określoną strukturę siatki umożliwiającą szybkie wnioskowanie.

— Aleksiej Zajcew
źródło

Dziękuję za Twój komentarz . Wydaje się, że ze względu na ich interpretację bayesowską modele procesu gaussowskiego mogą mieć dobrą kwantyfikację niepewności, jednak jest to również możliwe w regresji parametrycznej. Szukam technicznego podejścia, które może wyjaśnić zestaw przewag statystycznych

— Wis

Zalety modelu Gaussa.

Gaussowski PDF zależy tylko od momentów pierwszego i drugiego rzędu. Szeroko rozumiany stacjonarny proces gaussowski jest również ściśle stacjonarnym procesem i odwrotnie.

Gaussowskie pliki PDF mogą modelować rozkład wielu procesów, w tym niektórych ważnych klas sygnałów i szumów. Suma wielu niezależnych procesów losowych ma rozkład Gaussa (centralne twierdzenie graniczne).

Procesy inne niż gaussowskie można aproksymować za pomocą ważonej kombinacji (tj. Mieszanki) szeregu pdfów gaussowskich o odpowiednich środkach i wariancjach.

Optymalne metody szacowania oparte na modelach Gaussa często prowadzą do rozwiązań liniowych i matematycznie wykonalnych.

— Wilson
źródło