Tilastollinen todennäköisyystulkinta

Tilastollinen todennäköisyystulkinta [1] eli todennäköisyyden frekvenssitulkinta [2] eli empiirinen todennäköisyystulkinta [3] on eräs laajalti ja yleisesti hyväksytty tulkinta todennäköisyyden luonteesta. Siinä tapahtuman todennäköisyys käsitetään sen suhteellisen osuuden eli frekvenssin raja-arvona. Tulkinnan mukaan, kun satunnaisilmiöstä on saatu otoksena riittävän suuri määrä tapauksia, voidaan satunnaismuuttujan todennäköisyysjakauma määrittää kokeellisesti halutulla tarkkuudella. Tämä tulkinta tarjoaa perustelut kokeellisen tieteen ja tilastolaskennan todennäköisyyslaskennan tarpeille.[4][2][3]

Klassisen todennäköisyystulkinta perustui symmetrian periaatteeseen, jota empiirinen tiede väheksyi. Niitä tilanteita varten, joissa alkeistapauksien todennäköisyydet poikkesivat toisistaan, tuli määrittää vaihtoehtoinen todennäköisyystulkinta. Tilastollisen tulkinta tarjosi samalla todennäköisyysjakauman estimointimenetelmän.[2][5]

Se tarjosi myös menetelmän käsitellä heikosti tunnettujen satunnaismuuttujien todennäköisyyksiä. Kun satunnaisilmiön tuottamia alkeistapauksia ja niiden suhdetta satunnaismuuttujan arvoihin tunnetaan heikosti, voidaan tilastollisella menetelmällä määrittää suoraan satunnaismuuttujan todennäköisyysjakauma.[4]

Määritelmä muokkaa

Tilastollisessa menetelmässä todennäköisyyksiä voidaan määrittää vain riittävän hyvin määritetyillä satunnaisilmiöille. Jos ilmön rakenne on näkyvissä, tulee kaikki eri alkeistapaukset olla yksikäsitteisesti määriteltyjä ja esiintyä riittävän yleisesti, jotta perusjoukko saadaan riittävällä varmuudella määritettyä. Tapahtumat, jotka ovat alkeistapauksien muodostamia perusjoukon osajoukkoja, tulisivat olla nekin yksikäsitteisesti määritettyjä. Alkeistapaus tulee aina joko kuulua tapahtumaan tai olla siihen kuulumatta, selkeästi. Tapahtuman suhteellinen frekvenssi on todennäköisyyden mitta, jota voidaan tarkentaa kasvattamalla satunnaisilmiöstä saatua otoksen kokoa. Tässä on lyhyesti tilastollisen todennäköisyystulkinnan ydin.[2][6][5][3]

Edellä kerrottu määritelmä voidaan pukea yksinkertaiseen matemaattiseen muotoon. Tutkitaan aluksi satunnaisilmiötä empiirisesti ja merkitään sen käyttäytyminen tilastoksi. Merkitään  :lla tapahtuman   toteutuneiden alkeistapauksien lukumäärää ja  :lla kaikkien alkeistapauksien lukumäärää. Näiden suhde on todennäköisyyden estimaatti eli likiarvoinen mitta:

  [2][4][6][7][8][3]

Tulkinnan mukaisesti selvästi odotetaan, että kun satunnaisilmiöstä saatujen alkeistapausten lukumäärä kasvaa, tarkentuu aiempi suhteellisen frekvenssin approksimaatio sen paremmaksi approksimaatioksi. Väitetäänkin, että alkeistapausten määrää jatkuvasti kasvatettaessa approksimaatiot tarkentuvat loputtomasti ja lähestyvät todennäköisyyden tarkkaa arvoa:

  [3]

Viimeistä ajatusta käsitellään suurten lukujen laissa, jossa toistojen kasvattaminen tarkentaa approksimaatiota. Todennäköisyyden arvoa, joka saadaan toistojen lukumäärän lisäämisellä, kutsutaan toisinaan empiiriseksi todennäköisyydeksi.[3]

Kritiikkiä muokkaa

Määritelmä on vain tilastollinen idea, jolla ei ole matemaattista pohjaa. Tämä ei ole todennäköisyyden matemaattinen perustelu tai määritelmä, vaan lähinnä filosofinen ja ihmisen käytännön tarpeita palveleva ajatusmalli. Edes raja-arvo ei ole matemaattisesti pätevällä tavalla määritelty ja äärettömän otoksen ottaminen satunnaisilmiöstä on mahdoton tehtävä. Toisaalta, jos satunnaisilmiö ei käyttäydy hyvin, mitään yksittäistä lukuarvoa ei voida liittää raja-arvoon. Empiiristä todennäköisyyttä ei voida myöskään määrittää sellaisesta satunnaisilmiöstä, josta ei ole tehty havaintoja.[2][3]

Jakob Bernoulli perusteli approksimaatioiden käyttöä ajatuksellaan, että riittävän suuri otos tapasi moraalisen varmuuden, vaikka absoluuttista varmuutta ei voidakkaan saavuttaa. Hänen rajansa moraaliselle varmuudelle oli se, että asiaintila toteutui 999 kertaa 1000 yrityksestä.[9]

Eräät eivät pidä tilastollista todennäköisyyttä todellisena todennäköisyytenä ollenkaan, vaan tilastollisesti stabiilisti käyttäytyvän suhteellisen frekvenssin ominaisuutena.[3]

Lähteet muokkaa

  1. Etälukio: Todennäköisyyden käsite (Arkistoitu – Internet Archive)
  2. a b c d e f Koskenoja, Mika: Sattuman matematiikkaa I - klassinen todennäköisyys, matematiikkalehti Solmu, 2002
  3. a b c d e f g h Mellin, Ilkka: Todennäköisyyslaskenta: Todennäköisyys ja sen laskusäännöt (luentomoniste), Aaltoyliopisto
  4. a b c Alatupa, Sami et al.: Pitkä Sigma 3, s. 43−54. (lukion pitkän matematiikan oppikirja). Helsinki: Otava, 2010. ISBN 978-951-31-5343-4.
  5. a b Kivelä, Simo K.: Todennäköisyysfunktio P, M niin kuin matematiikka, 10.8.2000
  6. a b Kivelä, Simo K.: Todennäköisyyslaskennan peruskäsitteet, M niin kuin matematiikka, 10.8.2000
  7. Kivelä, Simo K.: Esimerkkejä kombinatorisesta todennäköisyyslaskennasta, M niin kuin matematiikka, 10.8.2000
  8. Saarnisaari, Harri (Arkistoitu – Internet Archive): Todennäköisyys (Arkistoitu – Internet Archive) (luentomateriaalia), 2003
  9. Lehtinen, Matti: 15. Todennäköisyyslaskenta: ajanvietteestä tiedettä (tai moniste), Matematiikan historista, 2000