Varianssi

todennäköisyyslaskennassa ja tilastotieteessä satunnaismuuttujan hajonnan mitta

Varianssi on todennäköisyyslaskennassa ja tilastotieteessä satunnaismuuttujan hajonnan mitta. Varianssi kuvaa sitä, kuinka paljon satunnaismuuttujan arvot keskimäärin vaihtelevat odotusarvosta tai populaation keskiarvosta. Varianssissa yksittäisen mittauksen poikkeamat keskiarvosta tai odotusarvosta korotetaan toiseen potenssiin (neliöön). Varianssi saadaan ottamalla keskiarvo näistä neliöön korotetuista eroista. Kun arvot keskittyvät odotusarvon ympärille tiiviisti, on varianssin arvo pieni, ja kun arvot ovat hajallaan odotusarvon ympärillä, on sen arvo suuri. Reaaliarvoisen satunnaismuuttujan varianssi on sen toinen keskusmomentti. Varianssin yksikkö on satunnaismuuttujan yksikkö korotettuna toiseen potenssiin. Varianssin neliöjuurta sanotaan keskihajonnaksi, jonka yksikkö on sama kuin satunnaismuuttujalla.[1][2][3][4]

Määritelmä ja merkinnät muokkaa

Matemaattisesti varianssi   määritellään reaaliarvoisen satunnaismuuttujan   odotusarvon   avulla

  [2]

missä   on satunnaismuuttujan odotusarvo. Varianssin arvo on ääretön, ellei odotusarvo   ole äärellisenä olemassa. Varianssi voidaan merkitä myös

  [2][4]

Varianssin avulla voidaan esittää myös keskihajonta eli standardipoikkeama   [2]

Diskreetti satunnaismuuttuja muokkaa

Diskreetin satunnaismuuttujan varianssi lasketaan

  [2][3][4]

missä   on jakauman pistetodennäköisyysfunktio.

Jatkuva satunnaismuuttuja muokkaa

Jatkuvan satunnaismuuttujaparin varianssi on taas

  [2][3][4]

missä   on jakauman tiheysfunktio.

Ominaisuuksia muokkaa

Rinnakkaiskaavan johtaminen muokkaa

Varianssin lauseketta voidaan kehittää edelleen käyttämällä hyväksi odotusarvon ominaisuuksia:[2]

 

Ensimmäistä muotoa kutsutaan toiseksi keskusmomentiksi ja viimeisessä muodossa käytetään toista ja ensimmäistä origomomenttia.[4]

Varianssin laskemiseksi on käytössä myös tekijämomentin sisältävä muoto:

  [3]

Ominaisuuksia muokkaa

Varianssin arvo on aina epänegatiivinen. Kun varianssi on nolla, ei arvoissa esiinny vaihtelua ja satunnaismuuttuja antaa vain samoja arvoja. Siten

  [3]

Varianssi on kovarianssi kahden identtisen satunnaismuuttujan välillä

  [5] (kovarianssi)

Päättelysääntöjä summista muokkaa

Jokaisen satunnaismuuttujan arvoon lisätty vakio ei vaikuta varianssin arvoon eli

  [2][3][4]

mutta arvojen kertominen vakiolla kasvattavat   tai vähentävät   varianssia

  [2][3][4]

Kahden satunnaismuuttujan lineaarikombinaatiossa varianssiin vaikuttaa myös satunnaismuuttujien kovarianssi

  [2]

mikä merkitään yleisemmässä tapauksessa

  [2][4]

Nämä arvot voidaan käsitellä hallitummin kovarianssimatriisissa.[6] Tämä ominaisuus vaikuttaa myös satunnaismuuttujien summan varianssiin

  [4]

Kovarianssia ei tarvitse huomioida, mikäli satunnaismuuttujat ovat korreloimattomia   jolloin

 

Riippumattomat satunnaismuuttujat ovat aina korreloimattomia. Korreloimattomilla satunnaismuuttujilla välimerkki ei vaikuta varianssin arvoon

  [2]

Päättelysääntöjä tuloista muokkaa

Kahden satunnaismuuttujan tulon varianssi voidaan määrittää odotusarvon ominaisuuksien avulla

 

Populaatio- ja otosvarianssi muokkaa

Varianssi lasketaan äärelliselle populaatiolle   seuraavasti

  [1][7][4]

missä   on populaation keskiarvo. Tätä kutsutaan toisinaan otosvarianssiksi, mutta termin käyttö on vaihtelevaa. Kun   on otos laajemmasta populaatiosta,   on varianssin tarkentuva mutta harhainen estimaatti. Harhaton estimaatti on

  [1][7][4]

jota yleensä kutsutaan otosvarianssiksi. Suurten otosten tapauksessa ei ole käytännössä merkitystä kumpaa estimaattoria käytetään. Molempien keskihajonta saadaan ottamalla varianssista neliöjuuri.[7][4]

Lähteet muokkaa

  1. a b c Alatupa, Sami et al.: Pitkä Sigma 6, s. 31−42. (lukion pitkän matematiikan oppikirja). Helsinki: Otava, 2010. ISBN 978-951-31-5343-4.
  2. a b c d e f g h i j k l Mellin, Ilkka: Moniulotteiset satunnaismuuttujat ja jakaumat, s.165−173, luentomoniste kurssista Todennäköisyyslaskenta, Aalto-yliopisto, 2007
  3. a b c d e f g Ruskeapää, Heikki: Todennäköisyyslaskenta I (Arkistoitu – Internet Archive)(luentomoniste), Turun Yliopisto, 2012
  4. a b c d e f g h i j k l Weisstein, Eric W.: Variance (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)
  5. Weisstein, Eric W.: Covariance (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)
  6. Weisstein, Eric W.: Covariance Matrix (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)
  7. a b c Mellin, Ilkka: Lineaarinen regressioanalyysi, s.240−266, luentomoniste kurssista Todennäköisyyslaskenta, Aalto-yliopisto, 2007