Ero sivun ”Kovarianssi” versioiden välillä
[katsottu versio] | [katsottu versio] |
Poistettu sisältö Lisätty sisältö
p Botti lisäsi luokkaan Seulonnan_keskeiset_artikkelit |
selkeytetty kieltä, lisätty selityksiä, lähteitä ja kaavoja |
||
Rivi 1:
'''Kovarianssi''' on [[todennäköisyyslaskenta|todennäköisyyslaskennassa]] ja [[tilastotiede|tilastotieteessä]] kahden [[satunnaismuuttuja]]n välisen [[satunnaismuuttujien riippuvuus|riippuvuuden]] mitta. Se kuvaa, kuinka läheisesti muuttujat vaihtelevat yhdessä. Yksinkertaistaen voidaan havainnollistaa, että kovarianssi saa positiivisen arvon, kun satunnaismuuttujan arvot jäävät samalle puolelle [[odotusarvo|odotusarvoihinsa]] nähden, ja vastaavasti negatiivisen arvon, kun niiden arvot jäävät eri puolille odotusarvoihinsa nähden. Kovarianssi on [[yhteisjakauma|yhteisjakauman]] toinen [[keskusmomentti]], jonka [[Yksikkö (fysiikka)|yksiköksi]] eli dimenssioksi tulee kummankin satunnaismuuttujan yksiköiden tulo. Momentin käsitteeseen liittyy tulkinta, että kovarianssi on niin sanotun yhteisjakauman "todennäköisyysmassan painopisteen" <math>\scriptstyle (E[X],E[Y])</math> ympärillä tapahtuvan vaihtelun mitta. [[Korrelaatio]] on kovarianssin normalisoitu tunnusluku, joka on puolestaan dimenssiovapaa.<ref name=mellin210/>
Todennäköisyyslaskennassa kovarianssi on yhteisjakauman tunnusluku, kun taas tilastolaskennassa kovarianssi on todennäköisyyslaskennan tunnusluvun [[estimaatti]].
Matemaattisesti kovarianssi on määritelty kahden reaaliarvoisen satunnaismuuttujan ''X'' ja ''Y'' välillä seuraavasti:▼
== Määritelmä ja merkinnät ==
: <math>\operatorname{cov}(X, Y) = \operatorname{E}((X - \mu) (Y - \nu)),</math>▼
▲Matemaattisesti kovarianssi <math>\sigma_{XY}</math> on määritelty kahden reaaliarvoisen satunnaismuuttujan
missä <math>E[X]=\mu_X</math> ja <math>E[Y]=\mu_Y</math> ovat vastaavasti satunnaismuuttujien [[odotusarvo|odotusarvot]]. Kovarianssi voidaan merkitä erilaisilla vaihtoehtoisilla tavoilla, kuten esimerkiksi
:<math>\sigma_{XY}=\sigma(X,Y)=cov(X,Y)=Cov(X,Y) .</math> <ref name=mellin210/>
Yhteisjakaumassa voi esiintyä myös merkinnät <math>\sigma_X</math> ja <math>\sigma_Y</math>. Ne esittävät satunnaismuuttujien [[keskihajonta|keskihajontoja]] <math>\sigma_X=\sqrt{\sigma_X^2}</math> ja <math>\sigma_Y=\sqrt{\sigma_Y^2}</math>.<ref name=Covariance/>
=== Diskreetit satunnaismuuttujat ===
Diskreetin satunnaismuuttujaparin kovarianssi lasketaan
:<math>\sigma_{XY}=\sum_{x \in X} \sum_{y \in Y} (x-\mu_X)(y-\mu_Y)f_{XY}(x,y) ,</math> <ref name=mellin210/>
missä <math>f_{XY}(x,y)</math> on yhteisjakauman pistetodennäköisyysfunktio.
=== Jatkuvat satunnaismuuttujat ===
: <math>\operatorname{cov}(X, Y) = \operatorname{E}(XY)- \mu\nu.</math>▼
Jatkuvan satunnaismuuttujaparin kovarianssi on taas
:<math>\sigma_{XY}=\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} (x-\mu_X)(y-\mu_Y)f_{XY}(x,y) dydx , \,</math> <ref name=mellin210/>
missä <math>f_{XY}(x,y)</math> on yhteisjakauman tiheysfunktio.
== Ominaisuuksia ==
=== Rinnakkaiskaavan johtaminen ===
Yleisessä tilanteessa satunnaismuuttujat ovat toisistaan [[satunnaismuuttujien riippuvuus|riippuvia]] jossakin mielessä. Silloin kovarianssi voidaan kehittää edelleen hyödyntämällä odotusarvo-operaattorin tunnetut ominaisuudet:<ref name=mellin210/>
:<math>\begin{align}\sigma(X,Y)
&= \operatorname{E}[(X - \operatorname{E}[X]) (Y - \operatorname{E}[Y])] \\
&= \operatorname{E}[X Y - X \operatorname{E}[Y] - \operatorname{E}[X] Y + \operatorname{E}[X] \operatorname{E}[Y]] \\
&= \operatorname{E}[X Y] - \operatorname{E}[X] \operatorname{E}[Y] - \operatorname{E}[X] \operatorname{E}[Y] + \operatorname{E}[X] \operatorname{E}[Y] \\
&= \operatorname{E}[X Y] - \operatorname{E}[X] \operatorname{E}[Y] \\
&= \operatorname{E}[X Y] - \mu_X\mu_Y .
\end{align}</math>
=== Riippumattomuus ===
Jos satunnaismuuttujat ovat [[satunnaismuuttujien riippumattomuus|riippumattomia]], saadaan odotusarvoksi
▲:
Yleisen kovarianssin kehitetystä lausekkeesta tulee silloin
:<math>\begin{align}\operatorname{cov}(X,Y)&=\operatorname{E}[X Y] - \operatorname{E}[X] \operatorname{E}[Y] \\ &=\operatorname{E}[X] \operatorname{E}[Y] - \operatorname{E}[X] \operatorname{E}[Y]=0.\end{align}</math>
Siten, jos satunnaismuuttujat ovat riippumattomia toisistaan, saadaan kovarianssiksi nolla. Päinvastainen ei pidä aina paikkaansa, sillä kovarianssin ollessa nolla, ei satunnaismuuttujat aina ole riippumattomia toisistaan.<ref name=Covariance/><ref name=mellin210/>
=== Arvojoukko ===
▲: <math>\operatorname{cov}(X, X) = \operatorname{var}(X)\,</math>
Kovarianssin yksikkö määräytyy satunnaismuuttujien tulosta. Koska [[korrelaatio]]n arvo jää välille <math>-1 \le r_{XY} \le 1</math>, saadaan kovarianssin arvolle väli <math>-\sigma_X\sigma_Y \le \sigma_{XY} \le \sigma_X\sigma_Y</math>, missä <math>\sigma_X \sigma_Y</math> on keskihajontojen tulo.
▲: <math>\operatorname{cov}(X, Y) = \operatorname{cov}(Y, X)\,</math>
: <math>\operatorname{cov}\left(\sum_i{X_i}, \sum_j{Y_j}\right) = \sum_i{\sum_j{\operatorname{cov}\left(X_i, Y_j\right)}}</math>▼
=== Päättelysääntöjä ===
Kovarianssille voidaan johtaa seuraavia laskusääntöjä (<math>a, b</math> ovat reaalivakioita):
: <math>\sigma(X, a) = 0 \,</math>
: <math>\sigma(X, X) = \sigma^2(X)\,</math> eli <math>\sigma_{XX}=\sigma_X^2</math> <ref name=Covariance/><ref name=Variance/><ref name=mellin210/> ([[varianssi]])
: <math>\sigma(X, Y) = \sigma(Y, X)\,</math> <ref name=Covariance/> (symmetrisyys)
: <math>\sigma(aX, bY) = ab\, \sigma(X, Y)\,</math> (kertoimien ulosotto)
: <math>\sigma(X+a, Y+b) = \sigma(X, Y)\,</math> (vakionlisäys)
: <math>\sigma(X+Z, Y) = \sigma(X, Y) + \sigma(Z, Y)\,</math> <ref name=Covariance/> (summan kovarianssi)
: <math>\sigma(aX+bY, cW+dV) = ac\,\sigma(X,W)+ad\,\sigma(X,V)+bc\,\sigma(Y,W)+bd\,\sigma(Y,V)</math> (lineaarikombinaatiot)
▲: <math>\
== Tilastollinen kovarianssi ==
Arvioitaessa kahden tilastomuuttujan kovarianssia, käytetään [[esitimaatti|estimaattorina]] lauseketta
:<math>\sigma_{XY}=\sum_{i=1}^n \frac{(x_i-\bar x)(y_i-\bar y)}{n},</math> <ref name=Covariance/>
missä otoksen suuruus on <math>n</math> ja otoksen muuttujien keskiarvot ovat <math>\bar x</math> ja <math>\bar y</math>. Usein kuitenkin jaetaan summa otoksen suuruutta yhtä pienemmällä luvulla ([[vapausaste]])
:<math>\sigma_{XY}=\sum_{i=1}^n \frac{(x_i-\bar x)(y_i-\bar y)}{n-1} .</math> <ref name=mellin240/>
== Satunnaisvektorit ==
Kun ''X'' ja ''Y'' ovat ''n''- ja ''m''-ulotteisia [[vektori|pystyvektoreita]], ''n x m''-ulotteinen kovarianssimatriisi on määritelty:
: <math>\
Matriisit ''cov(X,Y)'' ja ''cov(Y,X)'' ovat toistensa [[transpoosi|transpooseja]]. Kun ''X'' on vektori, matriisia ''cov(X,X)'' sanotaan ''X'':n '''kovarianssimatriisiksi''' tai pidemmin '''varianssi-kovarianssi-matriisiksi'''.<ref name=CovarianceMatrix/>▼
== Korrelaatiokerroin ==
Kovarianssilla voidaan mitata satunnaismuuttujien riippuvuuksia, mutta satunnaismuuttujien keskihajonnat vaikuttavat myös kovarianssin arvoon. Tuloksesta voidaan puhdistaa keskihajontojen vaikutukset jakamalla kovarianssi niillä, saadaan uusi riippuvuuden mitta [[korrelaatiokerroin]]
:<math>\rho_{XY}=\frac{\sigma_{XY}}{\sigma_X \sigma_Y}.</math> <ref name=mellin210/>
Sen arvot vaihtelevat välillä <math>-1 \le \rho_{XY} \le 1</math> eikä sillä ole mittayksikköä.
== Lähteet ==
▲Matriisit ''cov(X,Y)'' ja ''cov(Y,X)'' ovat toistensa [[transpoosi|transpooseja]]. Kun ''X'' on vektori, matriisia ''cov(X,X)'' sanotaan ''X'':n '''kovarianssimatriisiksi''' tai pidemmin '''varianssi-kovarianssi-matriisiksi'''.
{{viitteet|viitteet=
* <ref name=Covariance>{{Verkkoviite | Osoite =http://mathworld.wolfram.com/Covariance.html | Nimeke = Covariance | Tekijä =Weisstein, Eric W. | Selite =Math World - A Wolfram Web Resource | Julkaisija =Wolfram Research | Kieli ={{en}} }}</ref>
* <ref name=Variance>{{Verkkoviite | Osoite =http://mathworld.wolfram.com/Variance.html | Nimeke = Variance | Tekijä =Weisstein, Eric W. | Selite =Math World - A Wolfram Web Resource | Julkaisija =Wolfram Research | Kieli ={{en}} }}</ref>
* <ref name=CovarianceMatrix>{{Verkkoviite | Osoite =http://mathworld.wolfram.com/CovarianceMatrix.html | Nimeke = Covariance Matrix | Tekijä =Weisstein, Eric W. | Selite =Math World - A Wolfram Web Resource | Julkaisija =Wolfram Research | Kieli ={{en}} }}</ref>
* <ref name=mellin210>Mellin, Ilkka: [http://math.aalto.fi/opetus/sovtoda/oppikirja/TodLaskSatMuutjaJak.pdf Moniulotteiset satunnaismuuttujat ja jakaumat], s.210−223, luentomoniste kurssista [http://math.tkk.fi/opetus/sovtoda/luennot/ Todennäköisyyslaskenta], Aalto-yliopisto, 2007</ref>
* <ref name=mellin240>Mellin, Ilkka: [http://math.aalto.fi/opetus/sovtoda/oppikirja/Regranal.pdf Lineaarinen regressioanalyysi], s.240−266, luentomoniste kurssista [http://math.tkk.fi/opetus/sovtoda/luennot/ Todennäköisyyslaskenta], Aalto-yliopisto, 2007</ref>
}}
[[Luokka:Todennäköisyyslaskenta]]
[[Luokka:
|