Ta odpowiedź składa się z części wprowadzającej, którą napisałem niedawno dla artykułu opisującego (skromne) przestrzenno-czasowe rozszerzenie „Universal Kriging” (Wielka Brytania), które samo w sobie jest skromnym uogólnieniem „Zwykłego krigingu”. Ma trzy podsekcje: Teoria podaje model statystyczny i założenia; Oszacowanie krótko przegląda oszacowanie parametru metodą najmniejszych kwadratów; a Prognozowanie pokazuje, jak kriging pasuje do frameworku uogólnionych obiektów najmniejszych (GLS). Dołożyłem starań, aby przyjąć notację znaną statystykom, zwłaszcza odwiedzającym tę stronę, i użyć pojęć, które są tutaj dobrze wyjaśnione.
Podsumowując, kriging jest najlepszą liniową bezstronną prognozą (BLUP) losowego pola. Oznacza to, że przewidywana wartość w dowolnym niespróbkowanym miejscu jest uzyskiwana jako liniowa kombinacja wartości i zmiennych towarzyszących obserwowanych w próbkowanych miejscach. (Nieznana, losowa) wartość ma tam założoną korelację z wartościami próbek (a wartości próbek są skorelowane między sobą). Ta informacja o korelacji łatwo przekłada się na wariancję prognozy. Wybrano współczynniki w kombinacji liniowej („masy kriginga”), które sprawiają, że ta wariancja jest tak mała, jak to możliwe, z zastrzeżeniem warunku zerowego odchylenia w prognozie. Szczegóły podano poniżej.
Teoria
Wielka Brytania obejmuje dwie procedury - jedną szacunkową, a drugą prognozową - przeprowadzoną w kontekście modelu GLS dla badanego obszaru. Modelowe GLS zakłada, że próbki danych jest wynikiem przypadkowych odchylenia wokół trendu i że te odchylenia są skorelowane. Trend rozumiany jest w ogólnym znaczeniu wartości, którą można określić przez liniową kombinację p nieznanych współczynników (parametrów) β = ( β 1 , β 2 , … , βzja, ( I = 1 , 2 , . . . , N ) p . (W całym tym stanowiskiem, pierwsza " oznacza macierzy przeniesienia i wszystkie wektory uważa się wektory kolumny).β=(β1,β2,…,βp)′′
W dowolnym miejscu w obszarze badań dostępna jest krotka atrybutów liczbowych zwanych „zmiennymi niezależnymi” lub „zmiennymi towarzyszącymi”. (Zazwyczaj y 1 = 1 jest „ składnikiem stałym”, y 2 i y 3 mogą być współrzędnymi przestrzennymi, a dodatkowe y iy=(y1,y2,…,yp)′y1=1y2y3yimoże reprezentować informacje przestrzenne, a także inne informacje pomocnicze, które są dostępne we wszystkich lokalizacjach na badanym obszarze, takie jak porowatość warstwy wodonośnej lub odległość do studni pompującej.) W każdym miejscu danych oprócz zmiennych towarzyszących y i = ( y i 1 , y i 2 , … , y i p ) ′ , powiązana obserwacja z i jest uważana za realizację zmiennej losowej Z i . Natomiast y iiyi=(yi1,yi2,…,yip)′ziZiyisą uważane za wartości określone przez lub charakteryzujące punkty lub małe regiony reprezentowane przez obserwacje (dane „wspierają”). nie są uważane za realizacje zmiennych losowych oraz muszą być związane z własnościami z któregokolwiek z Z I .yiZi
Kombinacja liniowa
wyraża oczekiwaną wartość Z i w kategoriach parametrów β , czyli wartość trendu w lokalizacji i . Proces szacowania wykorzystuje dane, aby znaleźć wartości p I , które stanowią nieznane parametry p I
E[Zi]=y′iβ=yi1β1+yi2β2+⋯+yipβp
Ziβiβ^iβi, podczas gdy proces prognozowania wykorzystuje dane w lokalizacjach
do obliczenia wartości w niespróbkowanej lokalizacji, która jest tutaj indeksowana jako
i = 0 . Cele estymacji są stałymi (
tj. Nieprzypadkowymi) parametrami, podczas gdy cel predykcji jest losowy, ponieważ wartość
z 0 obejmuje losową fluktuację wokół jej trendu
y ′ 0 β . Zazwyczaj prognozy są tworzone dla wielu lokalizacji korzystających z tych samych danych, zmieniając lokalizację
0i=1,2,…,ni=0z0y′0β0. Na przykład często wykonuje się prognozy, aby wyznaczyć powierzchnię wzdłuż regularnej siatki punktów odpowiednich do konturowania.
Oszacowanie
ZiZiZjcij
β^=Hz, H=(Y′C−1Y)−1Y′C−1
z=(z1,z2,…,zn)nY=(yij)npy′i,1≤i≤nC=(cij)nnpnHzβ^β^C=(cij)
Prognoza
z0
z^0=λ1z1+λ2z2+⋯+λnzn=λ′z.
λiz0z0ZiZ00=E[Z^0−Z0]=E[λ′Z−Z0].
n+1Z0Z=(Z1,Z2,…,Zn)0=E[λ′Z−Z0]=λ′E[Z]−E[Z0]=λ′(Yβ)−y′0β=(λ′Y−y′0)β=β′(Y′λ−y0)
β
Y^′λ=y0.
λZ^0−Z0
Var(Z^0−Z0)=E[(Z^0−Z0)2]=E[(λ′Z−Z0)2]=c00−2λ′c0+λ′Cλ
c0=(c01,c02,…,c0n)′Z0Zi, i≥1c00Z0
λpμY^′λ=y0n+p
(CY′Y0)(λμ)=(c0y0)
0pp1nnλλ=H′y0+C−1(1−YH)c0.
(Czytelnicy zaznajomieni z regresją wielokrotną mogą uznać za pouczające porównanie tego rozwiązania z rozwiązaniem kowariancji zwykłych równań zwykłych najmniejszych kwadratów , które wygląda prawie dokładnie tak samo, ale bez wyrażeń Lagrange'a.)
λ[H′y0]Z0z^0