Ero sivun ”Korrelaatio” versioiden välillä

[arvioimaton versio][arvioimaton versio]
Poistettu sisältö Lisätty sisältö
rv, turhaa sepustusta
Parodi (keskustelu | muokkaukset)
Ei muokkausyhteenvetoa
Rivi 6:
 
Korrelaatio voidaan laskea usealla eri tavalla muuttujien [[mitta-asteikko|mitta-asteikosta]] ja käyttötarkoituksesta riippuen. Tavallisesti korrelaatiolla tarkoitetaan Pearsonin korrelaatiokerrointa. Nimestä huolimatta sen esitti ensimmäisenä [[Francis Galton]]. Jos tarkasteltavat muuttujat on mitattu vain [[järjestysasteikko|järjestysasteikolla]], niin silloin korrelaation mittaamiseen soveltuu paremmin jokin [[ei-parametrinen]] korrelaatiokerroin.
 
== Riippuvuus voi olla vahva, vaikka korrelaatio olisi nolla ==
 
[[Image:Correlation examples.png|thumb|400px|right|Useita (''x'', ''y'')-parien pistejoukkoja sekä kunkin joukon ''x''- ja ''y''-koordinaattien korrelaatiokerroin. Korrelaatio heijastaa lineaarisen riippuvuuden suuntaa ja kohinaisuutta (hajontaa), kuten ylärivi kuvaa, muttei kulmakerrointa, kuten keskirivi kuvaa, eikä mitään epälineaarista riippuvuutta, kuten alarivi kuvaa. Huomaa, että keskimmäisen kuvaajan kulmakerroin on nolla mutta korrelaatiokerrointa ("0/0") ei voi laskea.]]
 
Korrelaatio mittaa ainoastaan lineaarista riippuvuutta, siis kertoo siitä, jos ensimmäisen muuttujan (x) suuret arvot ovat pieniä enemmän yhteydessä toisen muuttujan (y) suuriin arvoihin (tai päinvastoin pieniin arvoihin).
 
Jos riippuvuus on ei-lineaarinen, esimerkiksi suuret ja pienet x:n arvot liittyvät suuriin y:n arvoihin mutta keskisuuret x:n arvot pieniin (esimerkiksi käyrä y=x<sup>2</sup> välillä -10...10), korrelaatio voi olla nolla vaikka riippuvuus olisi täydellinen niin, x:n arvosta voitaisiin täydellisesti päätellä y:n arvo.
 
Oheisen kuvan alimman rivin pistejoukoissa selvästi muuttujien ''y'' ja ''x'' arvojen välillä on yhteys, riippuvuus, vaikka riippuvuus ei olekaan lineaarinen, suuret ''x'':n arvot eivät ole suuriin ''y'':n arvoihin yhteydessä sen useammin kuin pienetkään. Silti tieto ''x'':n arvosta auttaa niissäkin veikkaamaan ''y'':n arvoa.
 
== Korrelaatio ei todista syy-seuraussuhdetta==
 
Korrelaatio voi olla pienestä otoksesta johtuva sattuma. Voi myös olla, että ''y'' on ''x'':n syy tai päinvastoin, tai sitten jokin kolmas asia voi olla molempien syy, esimerkiksi jäätelönsyönti ja hukkumiset ovat kumpikin runsaampia kesällä mutta eivät silti ole toistensa syitä vaan kuumuus on molempien syy. Siis [[korrelaatio ei implikoi kausaliteettia]]. Usein se on kuitenkin hyvä vihje mahdollisesta syy-seuraussuhteesta.
 
==Pearsonin korrelaatiokerroin==