Ripleyn K-funktio on spatiaalisten tilastotieteen menetelmä, jolla voidaan analysoida pisteprosesseja. Datan tulee olla kaksiulotteista.[1] Kyseessä on monipuolinen menetelmä, jota voidaan käyttää eri mittakaavoissa ja sen avulla voidaan tutkia vetävätkö kahden eri pisteparven alkiot toisiaan vai hylkivätkö ne. [2]

Funktio

muokkaa

Ripleyn K-funktiota merkitään  :llä ja se määritellään seuraavasti:  , missä   on datan pisteiden määrä tietystä satunnaisesti valitusta pisteestä   etäisyydellä   pois lukien kyseinen piste itse,   on pisteiden tiheys koko tarkasteltavalla alueella ja   on odotusarvo[1],[2].

Keskeisin Ripleyn K-funktion ongelma on se, että se ei ota huomioon, että havaintopisteillä voi olla ryhmiä, jotka jatkuvat tarkastelualueen ulkopuolelle. Tämän takia käytetään yleensä niin sanottua reunakorjausta, jonka avulla tämä huomioidaan. Tällöin puhutaan yleensä Ripleyn K-funktion estimaatista. [2]

Ripleyn K-funktio R-ohjelmassa

muokkaa

Ripleyn K-funktio löytyy R-ohjelmassa spastat-nimisestä paketista, jossa se on komento nimeltä Kest.[3] Tällä saadaan aikaiseksi havaitun datan Ripleyn K-funktion estimaatti, jota sitten verrataan odotusarvon mukaiseen arvoon. Tällä tavalla voidaan havaitaita, onko data satannaista, ryhmittäistä vai tasaista.[2]

Lähteet

muokkaa
  1. a b Dixon, P.M.: ”Volume 3”, Ripley's K function (Encyclopedia of Environmetrics), s. 1796 – 1803. Iowa State University, 2002.
  2. a b c d Kantola, T: ”3. Tilastolliset menetelmät”, Lahopuun spatiaalinen jakautuminen Suomen talousmetsissä, s. 28-29. Metsänarvioimistieteen Pro Gradu-tutkielma. Helsingin yliopisto, 2010.
  3. Baddeley, A., Turner, R. ja Rubak, E.: Getting started with spatstat R-project. Viitattu 10.9.2014.