Ero sivun ”Hajontaluku” versioiden välillä

[arvioimaton versio][arvioimaton versio]
Poistettu sisältö Lisätty sisältö
Artikkelin laajentaminen
Sivun laajentaminen, välitallennus
Rivi 1:
[[Kuva:standard deviation diagram.svg|thumb|350px|Keskihajonta [[normaalijakauma]]n tapauksessa: yhden keskihajonnan etäisyys keskiarvosta rajaa todennäköisyysmassasta 68,27 %, kahden keskihajonnan etäisyys rajaa 95,45 % ja kolmen keskihajonnan etäisyys rajaa 99,73 %.]]
 
'''Hajontaluku''' on [[Tilastotiede|tilastotieteessä]] [[Todennäköisyysjakauma|todennäköisyysjakauman]] vaihtelunhajonnan eli hajonnansen [[Satunnaismuuttuja|satunnaismuuttujan]] vaihtelun [[mitta]].<ref name=":0">{{Kirjaviite|Nimeke = Introduction to Probability and Statistics|Julkaisija = McGraw-Hill Inc.|Tekijä = Milton, J.S., Arnold, J.C.|Vuosi = 1995}}</ref> Yleisimpiä hajontalukuja ovat [[keskihajonta]], [[varianssi]], [[otoskeskihajonta]], [[otosvarianssi]], [[kvantiili]] ja [[variaatiokerroin]]. <ref name=":1">{{Verkkoviite|osoite = http://www.fsd.uta.fi/menetelmaopetus/hajontaluvut/hajontaluvut.html|nimeke = Hajontaluvut|julkaisu = Yhteiskuntatieteellinen tietoarkisto|julkaisija = Tampereen yliopisto|viitattu = 10.4.2015|tekijä = |ajankohta = 31.08.2003}}</ref> Hajontaluvut ovat [[Keskiluku|keskilukujen]] ohella keskeisimpiä [[Jakauma|jakaumiin]] liittyviä käsitteitä.<ref name=":0" />
 
== Hajonnan mittaaminen ==
Hajontaluku on [[reaaliluku]], joka saa sitä suuremman arvon mitä enemmän vaihtelua jakauman [[Satunnaismuuttuja|satunnaismuuttujien]] arvoissa esiintyy. Yleensä tämä lasketaan mittaamalla havaittujen arvojen etäisyyttä havaintoarvojen [[Odotusarvo|odotus]]- tai [[Keskiarvo|keskiarvosta]]. Käytettävän hajontaluvun valinta riippuu käyttötarkoituksesta; eri hajontaluvut sopivat eri tilanteisiin riippuen, pyritäänkö tarkastelemaan jakauman absoluuttista vaiko suhteellista hajontaa. Jos otannassa ei ole vaihtelua, hajontaluku saa arvon nolla.<ref name=":0" />
 
UseinJoskus hajontaa kuvattaessa käytetään mittauksen kohteen kanssa samaa [[Mittayksikkö|yksikköä]]. Jos mittauksen kohteen yksikkö on esimerkiksi kilogramma, myös hajonnan yksikkönä käytetään kilogrammaa. Tällöin hajontalukua voi käyttää hajonnan absoluuttisten arvojen tarkasteluun. Tällaisia hajonnan mittoja ovat:
* [[Keskihajonta]]
* [[Vaihteluväli]]
* [[Kvantiili]]
* [[Kvartiiliväli]]
Rivi 15:
* [[Variaatiokerroin]]
* [[Hajonnan kvartiilikerroin]]
* [[Normaalijakauma|Normaalijakauman]] k[[Keskihajonta|eskihajonta]]
Muissa mittayksiköissä ilmaistuja hajontalukuja ovat:
Muita hajontalukuja ovat:
* [[Varianssi]]
* [[Otosvarianssi]]
Rivi 23 ⟶ 24:
 
=== Varianssi ===
Varianssi kuvaa, kuinka kaukana satunnaismuuttujan arvot ovat tyypillisesti sen odotusarvosta. Reaaliarvoisen satunnaismuuttujan varianssi on sen toinen keskimomentti. Varianssin [[Neliöjuuri|neliöjuurta]] sanotaan keskihajonnaksi.
 
[[Diskreetti matematiikka|Diskreetin]] jakauman varianssi lasketaan kaavalla
 
<math>Var(X)=\sigma^{2}_x = \operatorname{E}[ ( xX - \mu_x ) ^ 2 ]</math>, jossa xX on [[satunnaismuuttuja]] ja ''μ'' on sen [[odotusarvo]] tai [[keskiarvo]].<ref name=":2">{{Kirjaviite|Nimeke = Tilastolliset menetelmät: Kaavat|Julkaisija = TKK|Tekijä = Ilkka Mellin|Vuosi = 2006}}</ref>
 
[[Jatkuva funktio|Jatkuvan]] jakauman varianssi lasketaan kaavalla <math>Var(X)=\sigma^{2}_x = \int\limits_{-\infin}^{+\infin} (x-\mu_x)^2 f(x)dx </math>.<ref name=":2" /><ref name=":0" />
 
Diskreetillä jakaumalla on varianssi, jos <math>\sum\limits_{x_i \in \tau}(x_i - \mu_x)^2 p_i < \infin</math>. Jatkuvalla jakaumalla on varianssi, jos <math>\int\limits_{-\infin}^{+\infin} (x-\mu_x)^2 f(x)dx < \infin</math>.
 
=== Keskihajonta ===
Satunnaismuuttujan standardipoikkeama eli keskihajontakuvaakeskihajonta kuvaa keskimääräistä poikkeamaa odotusarvosta. Keskihajonta on varianssin neliöjuuri: <math>D(X)=\sigma_x = \sqrt{\sigma^{2}_x}</math>.<ref name=":1" /><ref name=":2" /> Etuna varianssiin nähden on tulkinnan helppous, sillä keskihajonnan asteikko vastaa mittausten asteikkoa.
 
=== Otosvarianssi ===
Otosvarianssi on varianssi, joka lasketaan suuremman joukon osajoukosta. Kun n lukuarvon joukko <math>y_1,y_2,\ldots,y_n</math> on suuremman joukon Y osajoukko, tämän otosvarianssi on <math>s^2 = \frac{\sum\limits_{i=1} ^{n} (y_{i} - \overline{y})^2}{n-1}</math>, missä <math>\overline{y} = \sum_{i = 1}^{n} \frac{y_{i}}{n} \, \, \, \, \, { \ }</math> on tutkittavan muuttujan y keskiarvo.<ref name=":2" />
 
=== Otoskeskihajonta ===
Otoksen <math>(y_1,\dots,y_n)</math> keskihajonnan harhaton estimaatti eli [[otoshajonta]] on otosvarianssin neliöjuuri:
 
:<math>s = \sqrt{\frac{\sum\limits_{i=1} ^{n} (y_{i} - \overline{y})^2}{n-1}}</math>.<ref name=":2" />
 
Kun luvut <math>y_1,y_2,\ldots,y_n</math> ovat satunnainen otos isommasta joukosta ''Y'', luku <math>s</math> on [[harhaton]] estimaatti joukon ''Y'' keskihajonnasta. Intuitiivisesti tämä selittyy sillä, että [[otoskeskiarvo]] <math>\overline{y}</math> poikkeaa joukon ''Y'' todellisesta keskiarvosta otoksen suuntaan, mikä tuottaisi keskihajonnan (<math>s</math> yllä) kaavaan liian pienen osoittajan, mutta yhdellä pienennetty nimittäjä kompensoi tämän harhan ja näin saadaan mahdollisimman hyvä estimaatti perusjoukon ''X'' keskihajonnasta.
 
Jos käytettävissä olisi joukon ''Y'' todellinen keskiarvo eikä vain otoksesta <math>y_1,y_2,\ldots,y_n</math> laskettua otoskeskiarvoa <math>\overline{y}</math>, nimittäjässä pitäisi olla ''n'' kuten yleensäkin [[keskihajonta|keskihajonnan]] kaavassa.
 
=== Kvantiili ===
Satunnaismuuttujan x β-kvantiili kβ , 0 < β < 1, on luku joka toteuttaa ehdot <math> P(x <k_β k_b)<= βb</math>
 
Kvartiilit ovat satunnaismuuttujan kertymäfunktiolta säännöllisin välein poimittuja prosenttipisteitä. Jakamalla järjestetty aineisto ''q'' kappaleeseen yhtä suuria joukkoja saadaan ''q''-kvantiili. Kvantiilit ovat aineiston arvoja luokkien rajalla. Näin ollen ''k'':nnes kvantiili on sellainen arvo ''x'', että todennäköisyys saada pienempi arvo kuin ''x'' on noin ''k/q''. Empiirisessä työssä kvantiilit lasketaan aineiston kertymäfunktiosta.
 
=== Variaatiokerroin ===
Variaatiokerroin on hajontaluku, joka ei ole mittayksikköön sidottu. Variaatiokertoimen avulla on mahdollista vertailla kahden eri mitta-asteikolla mitatun jakauman hajontoja. Variaatiokerroin <math>v </math> on määritelty keskihajonnan <math>s </math> ja keskiarvon <math>\bar{x} </math> osamääränä.<ref>{{Kirjaviite|Nimeke = Käyttäytymistieteiden Tilastolliset Menetelmät.|Julkaisija = Tammi|Tekijä = Nummenmaa, Lauri|Isbn = 951-26-5203-X.|Vuosi = 2004}}</ref><ref name=":0" />
 
<math>v = s/\bar{x}*100%</math>
 
=== Vaihteluväli ===
Vaihteluväli ''(range)'' on järjestys-, välimatka- ja suhdeasteikon muuttujille sopiva hajontaluku. Se ilmoittaa yksinkertaisesti pienimmän ja suurimman muuttujan arvon välin.<ref name=":1" />
 
== Käyttötarkoituksia ==
Hajonnan avulla on mahdollista saada kattavampi käsitys satunnaismuuttujan todennäköisimmistä arvoista. Esimekiksi joukkojen <math> A = (1, 1, 1, 9, 9, 9)</math> ja<math> B = (4, 5, 5, 5, 5, 6)</math> lukuja arpomalla saadaan alkioiden arvojen yhtäsuuresta odotusarvosta huolimatta hyvin erilaisia tuloksia. Tunnettujen hajontalukujan avulla onkin mahdollista arvioida erilaisten tapahtuimien todennäköisyyksiä, mikä on keskeista muun muassa riskienhallinnassa.
 
[[Fysiikka|Fysiikassa]], [[Kemia|kemiassa]] ja muissa mitattavissa [[Luonnontiede|luonnontieteissä]] mittaustulosten vaihtelua tarkastelemalla on mahdollista arvioida koetulosten luotettavuutta.
 
[[Biologia|Biologiassa]] [[Populaatio|populaation]] ominaisuuksien määrittämisessä on keskeistä huomioida havaittujen ominaisuuksien vaihtelu.
 
[[Rahoitusmatematiikka|Rahoitusmatematiikassa]] [[Sijoitusportfolio|portfolion]] odotetun tuoton varianssi ja keskihajonta kuvaavat sijotukseen kohdistuvaa [[Riski|riskiä]]. Mitä pienempi hajonta on, sitä todennäköisemmin sijoituksesta saatu tuotto vastaa sen odotusarvoa ja sitä houkuttelevampi sijoituskohde on.
 
[[Taloustiede|Taloustieteessä]], rahoituksessa ja muissa tieteissä hajontaa pyritään selittämään [[Regressioanalyysi|regressioanalyysillä]], joka kuvaa muuttujan saamien arvojen kuvaamista suhteessa toiseen muuttujaan.
<math>v = s/\bar{x}*100%</math>
 
== Katso myös ==
 
*[[Todennäköisyyslaskenta]]
*[[Jakauma]]
*[[Tilastotiede]]
*[[Todennäköisyysjakauma]]
*[[Normaalijakauma]]
*[[Keskiluku]]
*[[Varianssi]]
*[[Keskihajonta]]
*[[Otosvarianssi]]
*[[Otoskeskihajonta]]
*[[Kvantiili]]
*[[Variaatiokerroin]]
 
== Aiheesta muualla ==
Rivi 76 ⟶ 80:
 
== Lähteet ==
<references />{{Tynkä/Matematiikka}}
* Lauri Nummenmaa: ''Käyttäytymistieteiden Tilastolliset Menetelmät''. Tammi, 2004. ISBN 951-26-5203-X
{{Tynkä/Matematiikka}}
 
[[Luokka:Tilastotiede]]