Kriging-interpolointi

Kriging-interpolointi (engl. Kriging interpolation [1]) eli Pistekriging on (engl. Point Kriging [2]) on tilastotieteessä ja todennäköisyyslaskennassa ja erityisesti geostatistiikassa monimuuttujainen interpolointimenetelmä, jossa kriging-estimointimenetelmällä lasketaan pisteissä sijaitsevien pistemäisten näytteiden avulla kohdassa sijaitsevan kohteen suureen arvo . Jos näytteiden otos säilyy samana, voidaan laskea interpolointikäyrä (yksiulotteinen tapaus) tai -pinta (kaksiulotteinen tapaus) näytteiden lähiympäristössä. Kunkin arvioitavan kohdan arvo lasketaan määrittämällä ensin kaikille näytteille painokertoimet ja muodostamalla sitten painokertoimilla ja näytteiden arvoilla painotettu aritmeettinen keskiarvo

Yhden muuttujan arvojen interpolointia Pistekrigingiä käyttäen. Punainen käyrä näyttää menetelmän interpoloimat arvot ja neliöt merkitsevät näytteiden arvoja. Vihreällä käyrillä on rajattu 95% luottamusväli (pystysuuntaisena) olettaen estimoinnin olevan normaalisti jakautunut. Normaalijakauman odotusarvo sijaitsee punaisella käyrällä ja jakauman varianssi on estimoinnin krigingvarianssi. Tämä on kuvaajaa varten muutettu luottamusväliksi.
[3][4][1]

Pistekriging ei ole yksinkertainen menetelmä, koska painokertoimet lasketaan huomioimalla näytteiden keskinäiset riippuvuudet ja näytteiden ja kohteen väliset riippuvuudet. Riippuvuudet johtuvat estimoitavan suureen spatiaalisesta autokorrelaatiosta. Kun käytetään näytteen otosta, joudutaan painokertoimia määritettäessä ratkaisemaan yhtälön yhtälöryhmä.[3][2][4][1]

Taustaa muokkaa

Menetelmä on johdettu geostatistiikassa käytettävästä krigingistä, jolla estimoidaan suureen arvoja halutuissa kohdissa ja jossa suureen arvot muuttuvat tilassa spatiaalisesti levittäytyvän ilmiön vaikutuksesta. Geostatistiikassa ajatellaan, että tila muodostuu satunnaiskentästä  , jonka todennäköisyyslaskennallisia ominaisuuksia pyritään hyödyntämään tilastollisesti.[3][5]

Geostatistiikassa käytettävä Kriging on johdettu sovelluksia silmällä pitäen. Siitä voidaan kuitenkin modifioida interpolointimenetelmä yksinkertaistamalla sen alkuoletuksia. Ensiksi, näytteet eli arvojen otos ajatellaan olevan interpoloitavan funktion arvoja yksittäisissä pisteissä. Toiseksi, interpoloinnissa lasketaan vain käyrän tai pinnan arvoja annetuissa pisteissä. Aito kriging-estimointimenetelmä yrittää estimoida alojen tai tilojen sisältämiä suureen kokonaisarvoja. Kolmanneksi, eri pisteiden välisiä riippuvuuksia ilmaistaan annetulla kovarianssifunktiolla, korrelogrammilla tai variogrammilla. Tässä laskut on esitetty kovarianssifunktiolla.[3][6][5]

Merkinnät ja tavalliset reunaehdot muokkaa

Interpoloidaan funktiota, joka on määritelty avaruudessa  , missä dimensio voi olla esimerkiksi   eli taso tai   eli tila. Merkitään interpoloitavaa funktiota   kohdassa  , siihen tarvittavia näytteitä   paikoissa   ja kovarianssifunktion arvot merkitään  , kun pisteiden välinen etäisyys on halutulla metriikalla  , tai merkitään  , kun  .[4]

Interpolointimenetelmän tulee käyttäytyä näytteiden välisessä tilassa niin, että kaikki estimoidut arvot ovat odotusarvoltaan samat kuin on koko näyteavaruuden odotusarvo. Tässä esityksessä oletetaan satunnaiskentän odotusarvon   olevan vakio, mutta silti sen tarkka arvo olisi tuntematon. Yhtälöihin liitettävä harhattomuusehto eli normitus

 

saadaan siitä, että virheen odotusarvo pitäisi olla nolla:

 
 
 
 
 

Kovarianssifunktio on oltava positiividefiniitti eli

  [7]

Se on tasan nolla, kun riippuvuus näytteiden nälillä on olematon eli ne ovat tilastollisesti riippumattomia. Tällöin etäisyys   on ylittänyt riippuvuuden etäisyyden raja-arvon. Kovarianssi tulee saada suurimman arvonsa, kun etäisyys  . Yleensä vaaditaan, että kovarianssi saa näyteavaruuden tilastollisen varianssin

  [7][5]

Kovarianssi on yleensä monotonisesti laskeva käyrä.[7][5]

Arviovarianssin minimointi muokkaa

Geostatistiikassa Kriging-estimointi syntyy tilanteessa, jossa on voitu arvioida eri painokertoimien valinnan aiheuttaman virheen varianssi eli arviovarianssi  . Optimoimalla painokertoimia, voidaan virheen varianssia pienentää. Kriging-interpoloinnissa arvo lasketaan sellaisilla painokertoimilla, joilla virheen varianssi on pienimmillään. Tätä varianssin minimiarvoa kutsutaan Krigingvarianssiksi  . Se on yleensä pienempi kuin näyteavaruuden tilastollinen varianssi  .[3][1][5]

Interpoloinnin suorittaminen muokkaa

Seuraavassa selostetaan, miten kokonaisen alueen kaikki pisteet interpoloidaan, kun aina käytetään samoja näytteitä. Jos näytteet vaihdetaan välillä, tulee interpolointi aloittaa alusta uudelleen.

Interpoloinnin valmistelut muokkaa

Koska laskut ovat mutkikkaat ja usein käytetään useita näytteitä, voidaan laskut suorittaa vektori- ja matriisilaskutoimituksin. Aluksi lasketaan näytteiden   ja interpoloitavan kohteen   väliset riippuvuudet ja kootaan niistä kovarianssivektori, joka on pystyvektori[2][1]

 

Kootaan painokertoimet   samalla tavalla vektoriksi

 

Sitten määritetään kaikkien näytteiden väliset riippuvuudet ja kootaan ne kovarianssimatriisiin[8] (neliömatriisi)[3][2]

 

koska  [9]

Nyt lisätään normitusta eli harhattomuusehtoa varten matriisiin alimmaiseksi riviksi ja oikeanpuoleisemmaksi sarakkeeksi ykköset ja nolla matriisin kulmaan. Nämä ovat nyt[3][2][1][6]

 

Geostatistiikan teorian mukaan paras estimaatti saadaan sellaisilla painokertoimien   arvoilla, jotka saadaan yhtälöryhmän eli matriisiyhtälön[3][2][1]

 

ratkaisuna. Lagrangen parametri   tarvitaan mukana, jotta yhtälöiden rivit ja sarakkeet menisivät tasan. Matriisiyhtälö voidaan myös kirjoittaa vektorien ja matriisin nimillä

  [4]

jolloin ratkaisu saadaan kääntämällä matriisi  

  [3][4]

Matriisin kääntäminen voidaan tehdä Gaussin eliminointimenetelmällä.

Ensimmäisen pisteen interpolointi muokkaa

Saatu painokerroinvektori sisältää tarvittavat painokertoimet, joilla voi laske interpolaatiolle arvon

  [3]

Viimeinen lauseke voidaan merkitä ja laskea vektorilaskennalla, kun näytteistä muodostetaan lyhyt pystyvektori

 

ja sitten vektorit kerrotaan keskenään

 

Seuraavien pisteiden interpolointi muokkaa

Seuraavan pisteen   interpolointi, kun käytetään samoja näytteitä   kuin aikaisemmin, aloitetaan päivittämällä kovarianssivektori[4]

 

Koska interpoloitava piste   vaihtui, muuttuvat näytteiden   ja pisteen   väliset riippuvuudet, joten ne lasketaan aina uudelleen. Toisaalta, koska näytteet ovat samat, ei niiden väliset riippuvuudet ole vaihtuneet ja nyt voidaan hyödyntää valmiiksi käännettyä matriisia   painokertoimien   laskemisessa. Uudet painokertoimet lasketaan[4]

 

ja ne sijoitetaan lausekkeeseen

 

joka antaa uuden interpolaation. Tätä jatketaan kunnes halutaan vaihtaa uudet näytteet, jolloin aloitetaan valmistelemalla uusi matriisi  .

Krigingvarianssi muokkaa

Interpoloinnin krigingvarianssi pisteessä   lasketaan teorian mukaan

  [4]

missä ratkaisun mukaan on  , joten varianssi voidaan kirjoittaa

 

niillä painokertoimilla, joilla varianssi minimoituu.[3]

Pistekrigingin ominaisuuksia muokkaa

Pistekriging on eksakti interpolaatiomenetelmä, sillä näytteiden kohdissa   se antaa interpolaattoriksi näytteen arvon   krigingvarianssilla   Menetelmä on toisaalta tasoittava interpolaatio, koska interpoloinnin tuloksien   pisteessä   varianssit ovat näytepopulaation varianssi.[3][10]

Kun tarkastellaan Kriging-interpoloinnin tuottaman käyrän tai pinnan ominaisuuksia, periytyvät sen jatkuvuus- ja derivoituvuusominaisuudet käytettävän kovarianssifunktion vastaavista ominaisuuksista.[10]

Lähteet muokkaa

  1. a b c d e f g de Smith, Michael J. & Goodchild, Michael F. & Longley, Paul A.: Kriging interpolation, kirjasta Geospatial Analysis, 2015
  2. a b c d e f Dutter, Rudolf: Point Kriging (Arkistoitu – Internet Archive), sähkökirjasta Geostatistics (Arkistoitu – Internet Archive), Vienna University of Technology, 2003
  3. a b c d e f g h i j k l Matheron, Georges: The Theory Of Regionalized Variables And Its Applications. julkaisusarjasta "Les Cahiers du Centre de Morphologie Mathématique de Fontainebleu", nro 5. Pariisi, Ranska: École Nationale Supérieure des Mines de Paris, 1971. Verkkoversio (pdf) (viitattu 24.8.2015). (englanniksi)
  4. a b c d e f g h Bohling, Geoff: Kriging (Arkistoitu – Internet Archive), Kansas Geological Survey, 2005
  5. a b c d e Ronny Berndtsson & Akissa Bahri & Kenji Jinno: Regionalized variables (Arkistoitu – Internet Archive), Lundin yliopisto, Ruotsi, 1992
  6. a b Hengl, Tomislav: A Practical Guide to Geostatistical Mapping of Environmental Variables, s.14–20, ISBN 978-92-79-06904-8, European Comission, 2007
  7. a b c Heikkinen, Juha: Geostatistiikka (Arkistoitu – Internet Archive), luentomoniste, s.10–11, Helsingin Yliopisto, 2006
  8. Weisstein, Eric W.: Covariance Matrix (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)
  9. Weisstein, Eric W.: Covariance (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)
  10. a b Heikkinen, Juha: Geostatistiikka (Arkistoitu – Internet Archive), luentomoniste, s.32–38, Helsingin Yliopisto, 2006

Aiheesta muualla muokkaa