Załóżmy, że jest wektorem przyjmującym rozkład wielu zmiennych o nieznanej średniej i znanej macierzy wariancji-kowariancji . Obserwujemy z tego rozkładu i chcemy przewidzieć podstawie tych informacji za pomocą obiektywnego predyktora liniowego:(Z0,Z1, ... ,Zn)( μ , μ , … , μ )Σ(z1,z2), ... ,zn) z0
- Liniowy oznacza, że predykcja musi przyjąć postać aby współczynniki . Współczynniki te mogą zależeć co najwyżej od tego, co wiadomo z góry: mianowicie od wpisów .z0^=λ1z1+λ2)z2)+ ⋯ +λnznλjaΣ
Ten predyktor można również uznać za zmienną losową .Z0^=λ1Z1+λ2)Z2)+ ⋯ +λnZn
- Bezstronna oznacza, że oczekiwanie na jest równe jego (nieznanej) średniej .Z0^μ
Zapisywanie rzeczy daje pewne informacje na temat współczynników:
μ= E[Z0^] = E[λ1Z1+λ2)Z2)+ ⋯ +λnZn]=λ1mi[Z1] +λ2)mi[Z2)] + ⋯ +λnmi[Zn]=λ1μ + ⋯ +λnμ= (λ1+ ⋯ +λn) μ .
Druga linia wynika z liniowości oczekiwań, a cała reszta to prosta algebra. Ponieważ ta procedura ma działać niezależnie od wartości , najwyraźniej współczynniki muszą się sumować do jedności. Zapisując współczynniki w notacji wektorowej , można to starannie zapisać .μλ = (λja)′1 λ=1
Wśród zestawu wszystkich takich obiektywnych predyktorów liniowych szukamy takiego, który odbiega jak najmniej od rzeczywistej wartości , mierzonej w średniej kwadratowej pomieszczenia. To znowu jest obliczenie. Opiera się na dwuliniowości i symetrii kowariancji, której zastosowanie jest odpowiedzialne za sumowania w drugim wierszu:
mi[ (Z0^-Z0)2)]= E[ (λ1Z1+λ2)Z2)+ ⋯ +λnZn-Z0)2)]=∑i = 1n∑j = 1nλjaλjotvar [Zja,Zjot] - 2∑i = 1nλjavar [Zja,Z0] + var [Z0,Z0]=∑i = 1n∑j = 1nλjaλjotΣja , j- 2∑i = 1nλjaΣ0 , i+Σ0 , 0.
Stąd współczynniki można uzyskać, minimalizując tę kwadratową postać z zastrzeżeniem (liniowego) ograniczenia . Można to łatwo rozwiązać za pomocą metody mnożników Lagrange'a, uzyskując liniowy układ równań, „równania Kriginga”.1 λ=1
W aplikacji jest przestrzennym procesem stochastycznym („pole losowe”). Oznacza to, że dla dowolnego zestawu ustalonych (nieprzypadkowych) lokalizacji wektor wartości w tych lokalizacjach, jest losowy z pewnego rodzaju rozkładem wielu zmiennych. Napisz i zastosuj analizę, zakładając , że środki procesu we wszystkich lokalizacjach są takie same i przyjmując macierz kowariancji wartości procesów dla tych lokalizacje są znane z pewnością.Zx0, ... ,xnZ( Z(x0) , … , Z(xn) )Zja= Z(xja)n + 1xjan + 1
Zinterpretujmy to. Zgodnie z założeniami (w tym stałą średnią i znaną kowariancją) współczynniki określają minimalną wariancję możliwą do uzyskania przez dowolny estymator liniowy. Nazwijmy tę wariancję („OK” oznacza „zwykłe kriging”). To zależy wyłącznie od matrycy . Mówi nam, że jeśli mielibyśmy wielokrotnie próbkować od i użyć tych współczynników do przewidywania wartości na podstawie pozostałych wartości za każdym razem, toσ2)O KΣ(Z0, ... ,Zn)z0
Średnio nasze prognozy byłyby prawidłowe.
Zazwyczaj nasze przewidywania dotyczące odbiegałyby od od rzeczywistych wartości .z0σO Kz0
O wiele więcej należy powiedzieć, zanim można to zastosować w praktycznych sytuacjach, takich jak oszacowanie powierzchni na podstawie danych punktowych: potrzebujemy dodatkowych założeń dotyczących tego, w jaki sposób statystyczna charakterystyka procesu przestrzennego zmienia się w zależności od miejsca i od jednej realizacji do drugiej (chociaż , w praktyce zazwyczaj dostępna będzie tylko jedna realizacja). Ale ta ekspozycja powinna wystarczyć, aby śledzić, w jaki sposób poszukiwanie „Najlepszego” bezstronnego predyktora liniowego („BLUP”) prowadzi wprost do układu równań liniowych.
Nawiasem mówiąc, kriging jak zwykle praktykowany nie jest dokładnie taki sam jak estymacja najmniejszych kwadratów, ponieważ jest szacowana w procedurze wstępnej (znanej jako „wariografia”) przy użyciu tych samych danych. Jest to sprzeczne z założeniami tego wyprowadzenia, które zakładały, że była znana (a tym bardziej niezależna od danych). Tak więc na samym początku kriging ma pewne wady koncepcyjne i statystyczne. Przemyślani praktykujący zawsze byli tego świadomi i znaleźli różne twórcze sposoby (próby) uzasadnienia niespójności. (Posiadanie dużej ilości danych może naprawdę pomóc.) Istnieją teraz procedury jednoczesnego szacowaniaΣΣΣi przewidywanie zbioru wartości w nieznanych lokalizacjach. Wymagają nieco silniejszych założeń (normalność wielowymiarowa), aby osiągnąć ten wyczyn.