Ero sivun ”Kovarianssi” versioiden välillä

[katsottu versio][katsottu versio]
Poistettu sisältö Lisätty sisältö
p Botti lisäsi luokkaan Seulonnan_keskeiset_artikkelit
selkeytetty kieltä, lisätty selityksiä, lähteitä ja kaavoja
Rivi 1:
'''Kovarianssi''' on [[todennäköisyyslaskenta|todennäköisyyslaskennassa]] ja [[tilastotiede|tilastotieteessä]] kahden [[satunnaismuuttuja]]n välisen [[satunnaismuuttujien riippuvuus|riippuvuuden]] mitta. Se kuvaa, kuinka läheisesti muuttujat vaihtelevat yhdessä. Yksinkertaistaen voidaan havainnollistaa, että kovarianssi saa positiivisen arvon, kun satunnaismuuttujan arvot jäävät samalle puolelle [[odotusarvo|odotusarvoihinsa]] nähden, ja vastaavasti negatiivisen arvon, kun niiden arvot jäävät eri puolille odotusarvoihinsa nähden. Kovarianssi on [[yhteisjakauma|yhteisjakauman]] toinen [[keskusmomentti]], jonka [[Yksikkö (fysiikka)|yksiköksi]] eli dimenssioksi tulee kummankin satunnaismuuttujan yksiköiden tulo. Momentin käsitteeseen liittyy tulkinta, että kovarianssi on niin sanotun yhteisjakauman "todennäköisyysmassan painopisteen" <math>\scriptstyle (E[X],E[Y])</math> ympärillä tapahtuvan vaihtelun mitta. [[Korrelaatio]] on kovarianssin normalisoitu tunnusluku, joka on puolestaan dimenssiovapaa.<ref name=mellin210/>
'''Kovarianssi''' tarkoittaa [[todennäköisyyslaskenta|todennäköisyyslaskennassa]] kahden muuttujan välisen riippuvuuden mittaa. Se kuvaa, kuinka läheisesti muuttujat vaihtelevat yhdessä. Kovarianssi muuttuu positiivisemmaksi jokaisesta uudesta arvoparista, jotka poikkeavat keskiarvostaan samaan suuntaan. Vastaavasti se muuttuu negatiivisemmaksi, jos arvot poikkeavat eri suuntiin.
 
Todennäköisyyslaskennassa kovarianssi on yhteisjakauman tunnusluku, kun taas tilastolaskennassa kovarianssi on todennäköisyyslaskennan tunnusluvun [[estimaatti]].
Matemaattisesti kovarianssi on määritelty kahden reaaliarvoisen satunnaismuuttujan ''X'' ja ''Y'' välillä seuraavasti:
 
== Määritelmä ja merkinnät ==
: <math>\operatorname{cov}(X, Y) = \operatorname{E}((X - \mu) (Y - \nu)),</math>
Matemaattisesti kovarianssi <math>\sigma_{XY}</math> on määritelty kahden reaaliarvoisen satunnaismuuttujan ''<math>X''</math> ja ''<math>Y'' välillä</math> seuraavasti:avulla
: <math>\operatornamesigma_{covXY}(X, Y) = \operatorname{E}([(X - \mumu_X) (Y - \nu)mu_Y)],</math>
missä <math>E[X]=\mu_X</math> ja <math>E[Y]=\mu_Y</math> ovat vastaavasti satunnaismuuttujien [[odotusarvo|odotusarvot]]. Kovarianssi voidaan merkitä erilaisilla vaihtoehtoisilla tavoilla, kuten esimerkiksi
:<math>\sigma_{XY}=\sigma(X,Y)=cov(X,Y)=Cov(X,Y) .</math> <ref name=mellin210/>
 
Yhteisjakaumassa voi esiintyä myös merkinnät <math>\sigma_X</math> ja <math>\sigma_Y</math>. Ne esittävät satunnaismuuttujien [[keskihajonta|keskihajontoja]] <math>\sigma_X=\sqrt{\sigma_X^2}</math> ja <math>\sigma_Y=\sqrt{\sigma_Y^2}</math>.<ref name=Covariance/>
missä E on [[odotusarvo]]-operaattori, <math>E(X)=\mu</math> ja <math>E(Y)=\nu</math>.
 
=== Diskreetit satunnaismuuttujat ===
Laskutoimituksissa käytetään usein lyhyempää muotoa:
Diskreetin satunnaismuuttujaparin kovarianssi lasketaan
:<math>\sigma_{XY}=\sum_{x \in X} \sum_{y \in Y} (x-\mu_X)(y-\mu_Y)f_{XY}(x,y) ,</math> <ref name=mellin210/>
missä <math>f_{XY}(x,y)</math> on yhteisjakauman pistetodennäköisyysfunktio.
 
=== Jatkuvat satunnaismuuttujat ===
: <math>\operatorname{cov}(X, Y) = \operatorname{E}(XY)- \mu\nu.</math>
Jatkuvan satunnaismuuttujaparin kovarianssi on taas
:<math>\sigma_{XY}=\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} (x-\mu_X)(y-\mu_Y)f_{XY}(x,y) dydx , \,</math> <ref name=mellin210/>
missä <math>f_{XY}(x,y)</math> on yhteisjakauman tiheysfunktio.
 
== Ominaisuuksia ==
Jos ''X'' ja ''Y'' ovat [[riippumattomuus|riippumattomia]], <math>\operatorname{E}(XY) = \mu\nu</math> ja <math>\operatorname{cov}=0</math>. Päinvastainen ei pidä aina paikkaansa.
=== Rinnakkaiskaavan johtaminen ===
Yleisessä tilanteessa satunnaismuuttujat ovat toisistaan [[satunnaismuuttujien riippuvuus|riippuvia]] jossakin mielessä. Silloin kovarianssi voidaan kehittää edelleen hyödyntämällä odotusarvo-operaattorin tunnetut ominaisuudet:<ref name=mellin210/>
:<math>\begin{align}\sigma(X,Y)
&= \operatorname{E}[(X - \operatorname{E}[X]) (Y - \operatorname{E}[Y])] \\
&= \operatorname{E}[X Y - X \operatorname{E}[Y] - \operatorname{E}[X] Y + \operatorname{E}[X] \operatorname{E}[Y]] \\
&= \operatorname{E}[X Y] - \operatorname{E}[X] \operatorname{E}[Y] - \operatorname{E}[X] \operatorname{E}[Y] + \operatorname{E}[X] \operatorname{E}[Y] \\
&= \operatorname{E}[X Y] - \operatorname{E}[X] \operatorname{E}[Y] \\
&= \operatorname{E}[X Y] - \mu_X\mu_Y .
\end{align}</math>
 
=== Riippumattomuus ===
Kovarianssin yksikkö määräytyy muuttujien ''X'' ja ''Y'' tulon perusteella. [[Korrelaatio]] on välille [-1,1] skaalattu riippuvuuden mitta.
Jos satunnaismuuttujat ovat [[satunnaismuuttujien riippumattomuus|riippumattomia]], saadaan odotusarvoksi
: <math>\operatorname{covE}(X, Y)[XY] = \operatorname{E}(XY)-[X] \operatorname{E}[Y]= \mumu_X\numu_Y.</math>
 
Yleisen kovarianssin kehitetystä lausekkeesta tulee silloin
Seuraavat ovat laskusääntöjä kovarianssille, jossa ''a'' on kiinteä vakio:
:<math>\begin{align}\operatorname{cov}(X,Y)&=\operatorname{E}[X Y] - \operatorname{E}[X] \operatorname{E}[Y] \\ &=\operatorname{E}[X] \operatorname{E}[Y] - \operatorname{E}[X] \operatorname{E}[Y]=0.\end{align}</math>
Siten, jos satunnaismuuttujat ovat riippumattomia toisistaan, saadaan kovarianssiksi nolla. Päinvastainen ei pidä aina paikkaansa, sillä kovarianssin ollessa nolla, ei satunnaismuuttujat aina ole riippumattomia toisistaan.<ref name=Covariance/><ref name=mellin210/>
 
=== Arvojoukko ===
: <math>\operatorname{cov}(X, X) = \operatorname{var}(X)\,</math>
Kovarianssin yksikkö määräytyy satunnaismuuttujien tulosta. Koska [[korrelaatio]]n arvo jää välille <math>-1 \le r_{XY} \le 1</math>, saadaan kovarianssin arvolle väli <math>-\sigma_X\sigma_Y \le \sigma_{XY} \le \sigma_X\sigma_Y</math>, missä <math>\sigma_X \sigma_Y</math> on keskihajontojen tulo.
: <math>\operatorname{cov}(X, Y) = \operatorname{cov}(Y, X)\,</math>
: <math>\operatorname{cov}(aX, Y) = a\, \operatorname{cov}(X, Y)\,</math>
: <math>\operatorname{cov}\left(\sum_i{X_i}, \sum_j{Y_j}\right) = \sum_i{\sum_j{\operatorname{cov}\left(X_i, Y_j\right)}}</math>
 
=== Päättelysääntöjä ===
Kovarianssille voidaan johtaa seuraavia laskusääntöjä (<math>a, b</math> ovat reaalivakioita):
: <math>\sigma(X, a) = 0 \,</math>
: <math>\sigma(X, X) = \sigma^2(X)\,</math> eli <math>\sigma_{XX}=\sigma_X^2</math> <ref name=Covariance/><ref name=Variance/><ref name=mellin210/> ([[varianssi]])
: <math>\sigma(X, Y) = \sigma(Y, X)\,</math> <ref name=Covariance/> (symmetrisyys)
: <math>\sigma(aX, bY) = ab\, \sigma(X, Y)\,</math> (kertoimien ulosotto)
: <math>\sigma(X+a, Y+b) = \sigma(X, Y)\,</math> (vakionlisäys)
: <math>\sigma(X+Z, Y) = \sigma(X, Y) + \sigma(Z, Y)\,</math> <ref name=Covariance/> (summan kovarianssi)
: <math>\sigma(aX+bY, cW+dV) = ac\,\sigma(X,W)+ad\,\sigma(X,V)+bc\,\sigma(Y,W)+bd\,\sigma(Y,V)</math> (lineaarikombinaatiot)
: <math>\operatorname{cov}sigma\left(\sum_i{X_i}, \sum_j{Y_j}\right) = \sum_i{\sum_j{\operatorname{cov}sigma\left(X_i, Y_j\right)}}</math> <ref name=Covariance/> (useiden satunnaismuuttujien summat)
 
== Tilastollinen kovarianssi ==
Arvioitaessa kahden tilastomuuttujan kovarianssia, käytetään [[esitimaatti|estimaattorina]] lauseketta
:<math>\sigma_{XY}=\sum_{i=1}^n \frac{(x_i-\bar x)(y_i-\bar y)}{n},</math> <ref name=Covariance/>
missä otoksen suuruus on <math>n</math> ja otoksen muuttujien keskiarvot ovat <math>\bar x</math> ja <math>\bar y</math>. Usein kuitenkin jaetaan summa otoksen suuruutta yhtä pienemmällä luvulla ([[vapausaste]])
:<math>\sigma_{XY}=\sum_{i=1}^n \frac{(x_i-\bar x)(y_i-\bar y)}{n-1} .</math> <ref name=mellin240/>
 
== Satunnaisvektorit ==
Kun ''X'' ja ''Y'' ovat ''n''- ja ''m''-ulotteisia [[vektori|pystyvektoreita]], ''n x m''-ulotteinen kovarianssimatriisi on määritelty:
 
: <math>\operatorname{cov}sigma(X, Y) = \operatorname{E}((X-\mumu_X)(Y-\numu_Y)^\top).</math>
 
Matriisit ''cov(X,Y)'' ja ''cov(Y,X)'' ovat toistensa [[transpoosi|transpooseja]]. Kun ''X'' on vektori, matriisia ''cov(X,X)'' sanotaan ''X'':n '''kovarianssimatriisiksi''' tai pidemmin '''varianssi-kovarianssi-matriisiksi'''.<ref name=CovarianceMatrix/>
 
== Korrelaatiokerroin ==
Kovarianssilla voidaan mitata satunnaismuuttujien riippuvuuksia, mutta satunnaismuuttujien keskihajonnat vaikuttavat myös kovarianssin arvoon. Tuloksesta voidaan puhdistaa keskihajontojen vaikutukset jakamalla kovarianssi niillä, saadaan uusi riippuvuuden mitta [[korrelaatiokerroin]]
:<math>\rho_{XY}=\frac{\sigma_{XY}}{\sigma_X \sigma_Y}.</math> <ref name=mellin210/>
Sen arvot vaihtelevat välillä <math>-1 \le \rho_{XY} \le 1</math> eikä sillä ole mittayksikköä.
 
== Lähteet ==
Matriisit ''cov(X,Y)'' ja ''cov(Y,X)'' ovat toistensa [[transpoosi|transpooseja]]. Kun ''X'' on vektori, matriisia ''cov(X,X)'' sanotaan ''X'':n '''kovarianssimatriisiksi''' tai pidemmin '''varianssi-kovarianssi-matriisiksi'''.
{{viitteet|viitteet=
* <ref name=Covariance>{{Verkkoviite | Osoite =http://mathworld.wolfram.com/Covariance.html | Nimeke = Covariance | Tekijä =Weisstein, Eric W. | Selite =Math World - A Wolfram Web Resource | Julkaisija =Wolfram Research | Kieli ={{en}} }}</ref>
* <ref name=Variance>{{Verkkoviite | Osoite =http://mathworld.wolfram.com/Variance.html | Nimeke = Variance | Tekijä =Weisstein, Eric W. | Selite =Math World - A Wolfram Web Resource | Julkaisija =Wolfram Research | Kieli ={{en}} }}</ref>
* <ref name=CovarianceMatrix>{{Verkkoviite | Osoite =http://mathworld.wolfram.com/CovarianceMatrix.html | Nimeke = Covariance Matrix | Tekijä =Weisstein, Eric W. | Selite =Math World - A Wolfram Web Resource | Julkaisija =Wolfram Research | Kieli ={{en}} }}</ref>
 
* <ref name=mellin210>Mellin, Ilkka: [http://math.aalto.fi/opetus/sovtoda/oppikirja/TodLaskSatMuutjaJak.pdf Moniulotteiset satunnaismuuttujat ja jakaumat], s.210−223, luentomoniste kurssista [http://math.tkk.fi/opetus/sovtoda/luennot/ Todennäköisyyslaskenta], Aalto-yliopisto, 2007</ref>
== Katso myös ==
 
* <ref name=mellin240>Mellin, Ilkka: [http://math.aalto.fi/opetus/sovtoda/oppikirja/Regranal.pdf Lineaarinen regressioanalyysi], s.240−266, luentomoniste kurssista [http://math.tkk.fi/opetus/sovtoda/luennot/ Todennäköisyyslaskenta], Aalto-yliopisto, 2007</ref>
* [[Korrelaatio]]
}}
* [[Varianssi]]
 
[[Luokka:Todennäköisyyslaskenta]]
[[Luokka:Seulonnan keskeiset artikkelitTilastotiede]]