Kriging-interpolointi

Kriging-interpolointi (engl. Kriging interpolation ^[1]) eli Pistekriging on (engl. Point Kriging ^[2]) on tilastotieteessä ja todennäköisyyslaskennassa ja erityisesti geostatistiikassa monimuuttujainen interpolointimenetelmä, jossa kriging-estimointimenetelmällä lasketaan pisteissä $x_{i}\in \mathbb {R} ^{n}$ sijaitsevien pistemäisten näytteiden $f_{i}$ avulla kohdassa $x\in \mathbb {R} ^{n}$ sijaitsevan kohteen suureen arvo $f(x)$ . Jos näytteiden otos säilyy samana, voidaan laskea interpolointikäyrä (yksiulotteinen tapaus) tai -pinta (kaksiulotteinen tapaus) $f(x)$ näytteiden lähiympäristössä. Kunkin arvioitavan kohdan arvo lasketaan määrittämällä ensin kaikille näytteille painokertoimet $\lambda _{i}$ ja muodostamalla sitten painokertoimilla ja näytteiden arvoilla $f_{i}$ painotettu aritmeettinen keskiarvo

f(x)=\lambda _{1}f_{1}+\lambda _{2}f_{2}+\dots +\lambda _{n}f_{n}.

^[3]^[4]^[1]

Pistekriging ei ole yksinkertainen menetelmä, koska painokertoimet lasketaan huomioimalla näytteiden keskinäiset riippuvuudet ja näytteiden ja kohteen väliset riippuvuudet. Riippuvuudet johtuvat estimoitavan suureen spatiaalisesta autokorrelaatiosta. Kun käytetään $n$ näytteen otosta, joudutaan painokertoimia määritettäessä ratkaisemaan $n+1$ yhtälön yhtälöryhmä.^[3]^[2]^[4]^[1]

Taustaa

Menetelmä on johdettu geostatistiikassa käytettävästä krigingistä, jolla estimoidaan suureen arvoja halutuissa kohdissa ja jossa suureen arvot muuttuvat tilassa spatiaalisesti levittäytyvän ilmiön vaikutuksesta. Geostatistiikassa ajatellaan, että tila muodostuu satunnaiskentästä $Z(x)$ , jonka todennäköisyyslaskennallisia ominaisuuksia pyritään hyödyntämään tilastollisesti.^[3]^[5]

Geostatistiikassa käytettävä Kriging on johdettu sovelluksia silmällä pitäen. Siitä voidaan kuitenkin modifioida interpolointimenetelmä yksinkertaistamalla sen alkuoletuksia. Ensiksi, näytteet eli arvojen otos ajatellaan olevan interpoloitavan funktion arvoja yksittäisissä pisteissä. Toiseksi, interpoloinnissa lasketaan vain käyrän tai pinnan arvoja annetuissa pisteissä. Aito kriging-estimointimenetelmä yrittää estimoida alojen tai tilojen sisältämiä suureen kokonaisarvoja. Kolmanneksi, eri pisteiden välisiä riippuvuuksia ilmaistaan annetulla kovarianssifunktiolla, korrelogrammilla tai variogrammilla. Tässä laskut on esitetty kovarianssifunktiolla.^[3]^[6]^[5]

Merkinnät ja tavalliset reunaehdot

Interpoloidaan funktiota, joka on määritelty avaruudessa $x\in \mathbb {R} ^{n}$ , missä dimensio voi olla esimerkiksi $n=2$ eli taso tai $n=3$ eli tila. Merkitään interpoloitavaa funktiota $f(x)$ kohdassa $x$ , siihen tarvittavia näytteitä $f_{i}$ paikoissa $x_{i}$ ja kovarianssifunktion arvot merkitään $\sigma _{ij}=\sigma (h_{ij})$ , kun pisteiden välinen etäisyys on halutulla metriikalla $h_{ij}=||x_{i}-x_{j}||$ , tai merkitään $\sigma _{i}=\sigma (h_{i})$ , kun $h_{i}=||x-x_{i}||$ .^[4]

Interpolointimenetelmän tulee käyttäytyä näytteiden välisessä tilassa niin, että kaikki estimoidut arvot ovat odotusarvoltaan samat kuin on koko näyteavaruuden odotusarvo. Tässä esityksessä oletetaan satunnaiskentän odotusarvon $E[Z(x)]=\mu$ olevan vakio, mutta silti sen tarkka arvo olisi tuntematon. Yhtälöihin liitettävä harhattomuusehto eli normitus

\Sigma _{i=1}^{n}\lambda _{i}=\lambda _{1}+\lambda _{2}+\dots +\lambda _{n}=1,

saadaan siitä, että virheen odotusarvo pitäisi olla nolla:

E[f(x)-Z(x)]=E[f(x)]-E[Z(x)]

=E[\lambda _{1}f_{1}+\lambda _{2}f_{2}+\dots +\lambda _{n}f_{n}]-E[Z(x)]

=(\lambda _{1}E[f_{1}]+\lambda _{2}E[f_{2}]+\dots +\lambda _{n}E[f_{n}])-E[Z(x)]

=(\lambda _{1}\mu +\lambda _{2}\mu +\dots +\lambda _{n}\mu )-\mu ]

=(\lambda _{1}+\lambda _{2}+\dots +\lambda _{n})\mu -\mu ]=0.

Kovarianssifunktio on oltava positiividefiniitti eli

\sigma (h)\geq 0.

^[7]

Se on tasan nolla, kun riippuvuus näytteiden nälillä on olematon eli ne ovat tilastollisesti riippumattomia. Tällöin etäisyys $h$ on ylittänyt riippuvuuden etäisyyden raja-arvon. Kovarianssi tulee saada suurimman arvonsa, kun etäisyys $h=0$ . Yleensä vaaditaan, että kovarianssi saa näyteavaruuden tilastollisen varianssin

\sigma (0)=\sigma ^{2}.

^[7]^[5]

Kovarianssi on yleensä monotonisesti laskeva käyrä.^[7]^[5]

Arviovarianssin minimointi

Geostatistiikassa Kriging-estimointi syntyy tilanteessa, jossa on voitu arvioida eri painokertoimien valinnan aiheuttaman virheen varianssi eli arviovarianssi $\sigma _{E}^{2}$ . Optimoimalla painokertoimia, voidaan virheen varianssia pienentää. Kriging-interpoloinnissa arvo lasketaan sellaisilla painokertoimilla, joilla virheen varianssi on pienimmillään. Tätä varianssin minimiarvoa kutsutaan Krigingvarianssiksi $\sigma _{K}^{2}$ . Se on yleensä pienempi kuin näyteavaruuden tilastollinen varianssi $\sigma ^{2}$ .^[3]^[1]^[5]

Interpoloinnin suorittaminen

Seuraavassa selostetaan, miten kokonaisen alueen kaikki pisteet interpoloidaan, kun aina käytetään samoja näytteitä. Jos näytteet vaihdetaan välillä, tulee interpolointi aloittaa alusta uudelleen.

Interpoloinnin valmistelut

Koska laskut ovat mutkikkaat ja usein käytetään useita näytteitä, voidaan laskut suorittaa vektori- ja matriisilaskutoimituksin. Aluksi lasketaan näytteiden $x_{i}$ ja interpoloitavan kohteen $x$ väliset riippuvuudet ja kootaan niistä kovarianssivektori, joka on pystyvektori^[2]^[1]

{\tilde {k}}(x)={\begin{bmatrix}\sigma _{1}\\\sigma _{2}\\\vdots \\\sigma _{n}\end{bmatrix}}.

Kootaan painokertoimet $\lambda _{i}$ samalla tavalla vektoriksi

{\tilde {\lambda }}={\begin{bmatrix}\lambda _{1}\\\lambda _{2}\\\vdots \\\lambda _{n}\end{bmatrix}}.

Sitten määritetään kaikkien näytteiden väliset riippuvuudet ja kootaan ne kovarianssimatriisiin^[8] (neliömatriisi)^[3]^[2]

{\tilde {K}}={\begin{bmatrix}\sigma _{11}&\sigma _{12}&\cdots &\sigma _{1n}\\\sigma _{21}&\sigma _{22}&\cdots &\sigma _{2n}\\\vdots &\vdots &\ddots &\vdots \\\sigma _{n1}&\sigma _{n2}&\cdots &\sigma _{nn}\end{bmatrix}}={\begin{bmatrix}\sigma ^{2}&\sigma _{12}&\cdots &\sigma _{1n}\\\sigma _{21}&\sigma ^{2}&\cdots &\sigma _{2n}\\\vdots &\vdots &\ddots &\vdots \\\sigma _{m1}&\sigma _{m2}&\cdots &\sigma ^{2}\end{bmatrix}},

koska $\sigma _{ii}=\sigma ^{2}.$ ^[9]

Nyt lisätään normitusta eli harhattomuusehtoa varten matriisiin alimmaiseksi riviksi ja oikeanpuoleisemmaksi sarakkeeksi ykköset ja nolla matriisin kulmaan. Nämä ovat nyt^[3]^[2]^[1]^[6]

K={\begin{bmatrix}\sigma ^{2}&\sigma _{12}&\cdots &\sigma _{1n}&1\\\sigma _{21}&\sigma ^{2}&\cdots &\sigma _{2n}&1\\\vdots &\vdots &\ddots &\vdots &\vdots \\\sigma _{m1}&\sigma _{m2}&\cdots &\sigma ^{2}&1\\1&1&\cdots &1&0\end{bmatrix}}ja\,\,\,\,k(x)={\begin{bmatrix}\sigma _{1}\\\sigma _{2}\\\vdots \\\sigma _{n}\\1\end{bmatrix}}.

Geostatistiikan teorian mukaan paras estimaatti saadaan sellaisilla painokertoimien $\lambda _{i}$ arvoilla, jotka saadaan yhtälöryhmän eli matriisiyhtälön^[3]^[2]^[1]

{\begin{bmatrix}\sigma ^{2}&\sigma _{12}&\cdots &\sigma _{1n}&1\\\sigma _{21}&\sigma ^{2}&\cdots &\sigma _{2n}&1\\\vdots &\vdots &\ddots &\vdots &\vdots \\\sigma _{m1}&\sigma _{m2}&\cdots &\sigma ^{2}&1\\1&1&\cdots &1&0\end{bmatrix}}\cdot {\begin{bmatrix}\lambda _{1}\\\lambda _{2}\\\vdots \\\lambda _{n}\\\mu \end{bmatrix}}={\begin{bmatrix}\sigma _{1}\\\sigma _{2}\\\vdots \\\sigma _{n}\\1\end{bmatrix}}.

ratkaisuna. Lagrangen parametri $\mu$ tarvitaan mukana, jotta yhtälöiden rivit ja sarakkeet menisivät tasan. Matriisiyhtälö voidaan myös kirjoittaa vektorien ja matriisin nimillä

K\lambda =k(x),

^[4]

jolloin ratkaisu saadaan kääntämällä matriisi $K$

\lambda =K^{-1}k(x).

^[3]^[4]

Matriisin kääntäminen voidaan tehdä Gaussin eliminointimenetelmällä.

Ensimmäisen pisteen interpolointi

Saatu painokerroinvektori sisältää tarvittavat painokertoimet, joilla voi laske interpolaatiolle arvon

f(x)=\lambda _{1}f_{1}+\lambda _{2}f_{2}+\dots +\lambda _{n}f_{n}.

^[3]

Viimeinen lauseke voidaan merkitä ja laskea vektorilaskennalla, kun näytteistä muodostetaan lyhyt pystyvektori

f={\begin{bmatrix}f_{1}\\f_{2}\\\vdots \\f_{n}\end{bmatrix}}

ja sitten vektorit kerrotaan keskenään

f(x)=f^{T}\lambda ={\begin{bmatrix}f_{1}&f_{2}&\cdots &f_{n}\end{bmatrix}}\cdot {\begin{bmatrix}\lambda _{1}\\\lambda _{2}\\\vdots \\\lambda _{n}\end{bmatrix}}

Seuraavien pisteiden interpolointi

Seuraavan pisteen $x$ interpolointi, kun käytetään samoja näytteitä $f_{i}$ kuin aikaisemmin, aloitetaan päivittämällä kovarianssivektori^[4]

k(x)={\begin{bmatrix}\sigma _{1}\\\sigma _{2}\\\vdots \\\sigma _{n}\\1\end{bmatrix}}.

Koska interpoloitava piste $x$ vaihtui, muuttuvat näytteiden $x_{i}$ ja pisteen $x$ väliset riippuvuudet, joten ne lasketaan aina uudelleen. Toisaalta, koska näytteet ovat samat, ei niiden väliset riippuvuudet ole vaihtuneet ja nyt voidaan hyödyntää valmiiksi käännettyä matriisia $K^{-1}$ painokertoimien $\lambda$ laskemisessa. Uudet painokertoimet lasketaan^[4]

\lambda =K^{-1}k(x)

ja ne sijoitetaan lausekkeeseen

f(x)=\lambda _{1}f_{1}+\lambda _{2}f_{2}+\dots +\lambda _{n}f_{n},

joka antaa uuden interpolaation. Tätä jatketaan kunnes halutaan vaihtaa uudet näytteet, jolloin aloitetaan valmistelemalla uusi matriisi $K$ .

Krigingvarianssi

Interpoloinnin krigingvarianssi pisteessä $x$ lasketaan teorian mukaan

\sigma _{K}^{2}(x)=\sigma ^{2}-\lambda ^{T}k(x),

^[4]

missä ratkaisun mukaan on $K\lambda =k(x)$ , joten varianssi voidaan kirjoittaa

\sigma _{K}^{2}(x)=\sigma ^{2}-\lambda ^{T}K\lambda

niillä painokertoimilla, joilla varianssi minimoituu.^[3]

Pistekrigingin ominaisuuksia

Pistekriging on eksakti interpolaatiomenetelmä, sillä näytteiden kohdissa $x_{i}$ se antaa interpolaattoriksi näytteen arvon $f(x_{i})=f_{i}$ krigingvarianssilla $\sigma _{K}^{2}(x)=0.$ Menetelmä on toisaalta tasoittava interpolaatio, koska interpoloinnin tuloksien $f(x)$ pisteessä $x\neq x_{i}$ varianssit ovat näytepopulaation varianssi.^[3]^[10]

Kun tarkastellaan Kriging-interpoloinnin tuottaman käyrän tai pinnan ominaisuuksia, periytyvät sen jatkuvuus- ja derivoituvuusominaisuudet käytettävän kovarianssifunktion vastaavista ominaisuuksista.^[10]

Lähteet

↑ ^a ^b ^c ^d ^e ^f ^g de Smith, Michael J. & Goodchild, Michael F. & Longley, Paul A.: Kriging interpolation, kirjasta Geospatial Analysis, 2015
↑ ^a ^b ^c ^d ^e ^f Dutter, Rudolf: Point Kriging (Arkistoitu – Internet Archive), sähkökirjasta Geostatistics (Arkistoitu – Internet Archive), Vienna University of Technology, 2003
↑ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ ^j ^k ^l Matheron, Georges: The Theory Of Regionalized Variables And Its Applications. (julkaisusarjasta "Les Cahiers du Centre de Morphologie Mathématique de Fontainebleu", nro 5) Pariisi, Ranska: École Nationale Supérieure des Mines de Paris, 1971. Verkkoversio (pdf) Viitattu 24.8.2015. (englanniksi)
↑ ^a ^b ^c ^d ^e ^f ^g ^h Bohling, Geoff: Kriging (Arkistoitu – Internet Archive), Kansas Geological Survey, 2005
↑ ^a ^b ^c ^d ^e Ronny Berndtsson & Akissa Bahri & Kenji Jinno: Regionalized variables (Arkistoitu – Internet Archive), Lundin yliopisto, Ruotsi, 1992
↑ ^a ^b Hengl, Tomislav: A Practical Guide to Geostatistical Mapping of Environmental Variables, s.14–20, ISBN 978-92-79-06904-8, European Comission, 2007
↑ ^a ^b ^c Heikkinen, Juha: Geostatistiikka (Arkistoitu – Internet Archive), luentomoniste, s.10–11, Helsingin Yliopisto, 2006
↑ Weisstein, Eric W.: Covariance Matrix (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)
↑ Weisstein, Eric W.: Covariance (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)
↑ ^a ^b Heikkinen, Juha: Geostatistiikka (Arkistoitu – Internet Archive), luentomoniste, s.32–38, Helsingin Yliopisto, 2006

Aiheesta muualla

How to use Kriging (Arkistoitu – Internet Archive)
Firas Ajil Jassim & Fawzi Hasan Altaany: Krigingin soveltaminen valokuviin, Canadian Journal on Image Processing and Computer Vision, 2013

[gsa-1] ↑ ^a ^b ^c ^d ^e ^f ^g de Smith, Michael J. & Goodchild, Michael F. & Longley, Paul A.: Kriging interpolation, kirjasta Geospatial Analysis, 2015

[pk-2] ↑ ^a ^b ^c ^d ^e ^f Dutter, Rudolf: Point Kriging (Arkistoitu – Internet Archive), sähkökirjasta Geostatistics (Arkistoitu – Internet Archive), Vienna University of Technology, 2003

[gm-3] ↑ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ ^j ^k ^l Matheron, Georges: The Theory Of Regionalized Variables And Its Applications. (julkaisusarjasta "Les Cahiers du Centre de Morphologie Mathématique de Fontainebleu", nro 5) Pariisi, Ranska: École Nationale Supérieure des Mines de Paris, 1971. Verkkoversio (pdf) Viitattu 24.8.2015. (englanniksi)

[gb-4] ↑ ^a ^b ^c ^d ^e ^f ^g ^h Bohling, Geoff: Kriging (Arkistoitu – Internet Archive), Kansas Geological Survey, 2005

[rb-5] Ronny Berndtsson & Akissa Bahri & Kenji Jinno: Regionalized variables (Arkistoitu – Internet Archive), Lundin yliopisto, Ruotsi, 1992

[th14-6] Hengl, Tomislav: A Practical Guide to Geostatistical Mapping of Environmental Variables, s.14–20, ISBN 978-92-79-06904-8, European Comission, 2007

[jh10-7] Heikkinen, Juha: Geostatistiikka (Arkistoitu – Internet Archive), luentomoniste, s.10–11, Helsingin Yliopisto, 2006

[CovarianceMatrix-8] Weisstein, Eric W.: Covariance Matrix (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)

[Covariance-9] Weisstein, Eric W.: Covariance (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)

[jh32-10] Heikkinen, Juha: Geostatistiikka (Arkistoitu – Internet Archive), luentomoniste, s.32–38, Helsingin Yliopisto, 2006

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]