Ero sivun ”Hajontaluku” versioiden välillä

[arvioimaton versio][arvioimaton versio]
Poistettu sisältö Lisätty sisältö
Olen selkeyttänyt artikkelin rakennetta ja lisännyt tarkentavia tietoja eri hajontaluvuista.
Artikkelin laajentaminen
Rivi 1:
[[Kuva:standard deviation diagram.svg|thumb|350px|Keskihajonta [[normaalijakauma]]n tapauksessa: yhden keskihajonnan etäisyys keskiarvosta rajaa todennäköisyysmassasta 68,27 %, kahden keskihajonnan etäisyys rajaa 95,45 % ja kolmen keskihajonnan etäisyys rajaa 99,73 %.]]
 
'''Hajontaluku''' on [[Tilastotiede|tilastotieteessä]] [[Todennäköisyysjakauma|todennäköisyysjakauman]] vaihtelun eli hajonnan [[mitta]]. Yleisimpiä hajontalukuja ovat [[keskihajonta]], [[varianssi]], [[otoskeskihajonta]], [[otosvarianssi]], [[kvantiili]] ja [[variaatiokerroin]]. Hajontaluvut ovat [[Keskiluku|keskilukujen]] ohella keskeisimpiä [[Jakauma|jakaumiin]] liittyviä käsitteitä.
 
== Hajonnan mittaaminen ==
Hajontaluku on [[reaaliluku]], joka saa sitä suuremman arvon mitä enemmän vaihtelua jakauman [[Satunnaismuuttuja|satunnaismuuttujien]] arvoissa esiintyy. Yleensä tämä lasketaan mittaamalla havaittujen arvojen etäisyyttä havaintoarvojen [[Odotusarvo|odotus]]- tai [[Keskiarvo|keskiarvosta]]. Käytettävän hajontaluvun valinta riippuu käyttötarkoituksesta; eri hajontaluvut sopivat eri tilanteisiin riippuen, pyritäänkö tarkastelemaan jakauman absoluuttista vaiko suhteellista hajontaa. Jos otannassa ei ole vaihtelua, tätä kuvaava hajontaluku saa arvon nolla.
 
Usein hajontaa kuvattaessa käytetään mittauksen kohteen kanssa samaa [[Mittayksikkö|yksikköä]]. Jos mittauksen kohteen yksikkö on esimerkiksi kilogramma, myös hajonnan yksikkönä käytetään kilogrammaa. Tällöin hajontalukua voi käyttää hajonnan absoluuttisten arvojen tarkasteluun. Tällaisia hajonnan mittoja ovat:
==Hajontaluvut==
* [[Keskihajonta]]
* Vaihteluväli
* [[Kvantiili]]
* [[Kvartiiliväli]]
* [[Mediaanin keskipoikkeama]] (MAD)
Yksiköttömät hajontaluvut kuvaavat suhteellista hajontaa satunnaismuuttujan odotusarvoon nähden. Usein nämä voidaan ilmaista prosentteina. Tällöin on mahdollista vertailla myös eri yksiköissä ilmaistujen jakaumien hajontoja. Yksiköttömiä hajontalukuja ovat:
* [[Variaatiokerroin]]
* [[Hajonnan kvartiilikerroin]]
Muissa mittayksiköissä ilmaistuja hajontalukuja ovat:
* [[Varianssi]]
* [[Otosvarianssi]]
* [[Gini-kerroin]]
 
== Yleisimmät hajontaluvut ==
 
=== Varianssi ===
Varianssi on [[Todennäköisyyslaskenta|todennäköisyyslaskennassa]] ja tilastotieteessä satunnaismuuttujan hajonnan mitta. Varianssi kuvaa sitä, kuinka kaukana satunnaismuuttujan arvot ovat tyypillisesti sen odotusarvosta. Reaaliarvoisen satunnaismuuttujan varianssi on sen toinen keskimomentti. Varianssin [[Neliöjuuri|neliöjuurta]] sanotaan keskihajonnaksi.
 
Diskreetin jakauman varianssi lasketaan kaavalla
 
<math>Var(X)=\sigma^{2}_x = \operatorname{E}[ ( x - \mu_x ) ^ 2 ]</math>, jossa x on [[satunnaismuuttuja]] ja ''μ'' on sen [[odotusarvo]].
 
JakaumanJatkuvan jakauman varianssi lasketaan kaavalla <math>Var(X)=\sigma^{2}_x = \operatornameint\limits_{E-\infin}^{+\infin}[ ( X x- \mu mu_x) ^ 2 ]f(x)dx </math>, jossa ''X'' on [[satunnaismuuttuja]] ja ''μ'' on sen [[odotusarvo]].
 
Diskreetillä jakaumalla on varianssi, jos <math>\sum\limits_{x_i \in \tau}(x_i - \mu_x)^2 p_i < \infin</math>. Jatkuvalla jakaumalla on varianssi, jos <math>\int\limits_{-\infin}^{+\infin} (x-\mu_x)^2 f(x)dx < \infin</math>.
 
=== Keskihajonta ===
KeskihajontaSatunnaismuuttujan standardipoikkeama eli standardipoikkeamakeskihajontakuvaa keskimääräistä poikkeamaa odotusarvosta. Keskihajonta on varianssin neliöjuuri: <math>D(X)=\sigma_x = \sqrt{\sigma^{2}_x},</math>. Etuna varianssiin nähden on tulkinnan helppous, sillä keskihajonnan asteikko vastaa mittausten asteikkoa.
 
Otosvarianssi
Äärellisen joukon <math>x_1,x_2,\ldots,x_n</math> keskihajonta on
 
<math>\sigma = \sqrt{\frac{\sum\limits_{i=1} ^{n} (x_{i} - \overline{x})^2}{n}}</math>, missä <math>\bar{x} = \frac1n\sum\limits_{i=1}^n x_i = \frac{(x_1+\cdots+x_n)}{n}</math> on kyseisen joukon keskiarvo.
 
Keskihajonta on siis varianssin neliöjuuri. Keskihajonta kuvaa keskimääräistä poikkeamaa odotusarvosta. Etuna varianssiin nähden on tulkinnan helppous, sillä keskihajonnan asteikko vastaa mittausten asteikkoa.
 
=== Otoskeskihajonta ===
Rivi 34 ⟶ 48:
 
=== Kvantiili ===
Satunnaismuuttujan x β-kvantiili kβ , 0 < β < 1, on luku joka toteuttaa ehdot <math> P(x <k_β)≤ β</math>
Kvantiilit ovat satunnaismuuttujan kertymäfunktiolta säännöllisin välein poimittuja prosenttipisteitä. Jakamalla järjestetty aineisto ''q'' kappaleeseen yhtä suuria joukkoja saadaan ''q''-kvantiili. Kvantiilit ovat aineiston arvoja luokkien rajalla. Näin ollen ''k'':nnes kvantiili on sellainen arvo ''x'', että todennäköisyys saada pienempi arvo kuin ''x'' on noin ''k/q''. Empiirisessä työssä kvantiilit lasketaan aineiston kertymäfunktiosta.
 
KvantiilitKvartiilit ovat satunnaismuuttujan kertymäfunktiolta säännöllisin välein poimittuja prosenttipisteitä. Jakamalla järjestetty aineisto ''q'' kappaleeseen yhtä suuria joukkoja saadaan ''q''-kvantiili. Kvantiilit ovat aineiston arvoja luokkien rajalla. Näin ollen ''k'':nnes kvantiili on sellainen arvo ''x'', että todennäköisyys saada pienempi arvo kuin ''x'' on noin ''k/q''. Empiirisessä työssä kvantiilit lasketaan aineiston kertymäfunktiosta.
 
=== Variaatiokerroin ===
Variaatiokerroin on hajontaa kuvaava suhdeluku eli hajontaluku, joka ei ole mittayksikköön sidottu. Variaatiokertoimen avulla voion mahdollista vertailla kahden eri mitta-asteikolla mitatun jakauman hajontoja. Variaatiokerroin <math>v </math> on määritelty keskihajonnan <math>s </math> ja keskiarvon <math>\bar{x} </math> osamääränä.
 
<math>v = s/\bar{x}*100%</math>
 
== Katso myös ==
 
*[[Jakauma]]
*[[Todennäköisyysjakauma]]
*[[Normaalijakauma]]
*[[Keskiluku]]
*[[Varianssi]]
*[[Keskihajonta]]
*[[Otosvarianssi]]
*[[Otoskeskihajonta]]
*[[Kvantiili]]
*[[Variaatiokerroin]]
 
== Aiheesta muualla ==
Rivi 47 ⟶ 74:
*[http://www.techbookreport.com/tutorials/stddev-30-secs.html Hajontaluvun selitys ilman matematiikkaa] {{en}}
{{Metatieto}}
 
== Lähteet ==
* Lauri Nummenmaa: ''Käyttäytymistieteiden Tilastolliset Menetelmät''. Tammi, 2004. ISBN 951-26-5203-X
{{Tynkä/Matematiikka}}