Ero sivun ”Hajontaluku” versioiden välillä

[katsottu versio][arvioimaton versio]
Poistettu sisältö Lisätty sisältö
p Botti lisäsi luokkaan Seulonnan keskeiset artikkelit
Olen selkeyttänyt artikkelin rakennetta ja lisännyt tarkentavia tietoja eri hajontaluvuista.
Rivi 1:
[[Kuva:standard deviation diagram.svg|thumb|350px|Keskihajonta [[normaalijakauma]]n tapauksessa: yhden keskihajonnan etäisyys keskiarvosta rajaa todennäköisyysmassasta 68,27 %, kahden keskihajonnan etäisyys rajaa 95,45 % ja kolmen keskihajonnan etäisyys rajaa 99,73 %.]]
 
'''Hajontaluku''' on [[Tilastotiede|tilastotieteessä]] aineiston[[Todennäköisyysjakauma|todennäköisyysjakauman]] vaihtelun eli hajonnan mitta. HajontalukuYleisimpiä onhajontalukuja ovat [[reaalilukukeskihajonta]], joka[[varianssi]], saa[[otoskeskihajonta]], suuren[[otosvarianssi]], arvon kun aineistossa[[kvantiili]] onja paljon vaihtelua[[variaatiokerroin]]. Jos aineistossa ei ole vaihtelua eli havainnotHajontaluvut ovat samoja,[[Keskiluku|keskilukujen]] ohella saakeskeisimpiä sejakaumiin arvonliittyviä nollakäsitteitä.
 
== Hajonnan mittaaminen ==
Yleisimpiä hajontalukuja ovat:
Hajontaluku on [[reaaliluku]], joka saa sitä suuremman arvon mitä enemmän vaihtelua jakauman [[Satunnaismuuttuja|satunnaismuuttujien]] arvoissa esiintyy. Jos otannassa ei ole vaihtelua, tätä kuvaava hajontaluku saa arvon nolla.
* [[varianssi]] <math>Var(X)=\sigma^{2}_x = \operatorname{E}[ ( X - \mu ) ^ 2 ]</math>
** Diskreetillä jakaumalla on varianssi, jos <math>\sum\limits_{x_i \in \tau}(x_i - \mu_x)^2 p_i < \infin</math>
** Jatkuvalla jakaumalla on varianssi, jos <math>\int\limits_{-\infin}^{+\infin} (x-\mu_x)^2 f(x)dx < \infin</math>
 
==Hajontaluvut==
* keskihajonta, eli standardipoikkeama <math>D(X)=\sigma_x = \sqrt{\sigma^{2}_x},</math>
 
missä ''X'' on [[satunnaismuuttuja]] ja ''μ'' on sen [[odotusarvo]]. Keskihajonta on siis varianssin neliöjuuri. Keskihajonta kuvaa keskimääräistä poikkeamaa odotusarvosta. Sen etu varianssiin verrattuna on, että se on helppo tulkita, koska keskihajonnan asteikko vastaa mittausten asteikkoa.
=== Varianssi ===
Varianssi on [[Todennäköisyyslaskenta|todennäköisyyslaskennassa]] ja tilastotieteessä satunnaismuuttujan hajonnan mitta. Varianssi kuvaa sitä, kuinka kaukana satunnaismuuttujan arvot ovat tyypillisesti sen odotusarvosta. Reaaliarvoisen satunnaismuuttujan varianssi on sen toinen keskimomentti. Varianssin [[Neliöjuuri|neliöjuurta]] sanotaan keskihajonnaksi.
 
*Jakauman [[varianssi]] lasketaan kaavalla <math>Var(X)=\sigma^{2}_x = \operatorname{E}[ ( X - \mu ) ^ 2 ]</math>, jossa ''X'' on [[satunnaismuuttuja]] ja ''μ'' on sen [[odotusarvo]].
 
** Diskreetillä jakaumalla on varianssi, jos <math>\sum\limits_{x_i \in \tau}(x_i - \mu_x)^2 p_i < \infin</math>. Jatkuvalla jakaumalla on varianssi, jos <math>\int\limits_{-\infin}^{+\infin} (x-\mu_x)^2 f(x)dx < \infin</math>.
 
=== Keskihajonta ===
* keskihajonta,Keskihajonta eli standardipoikkeama on varianssin neliöjuuri: <math>D(X)=\sigma_x = \sqrt{\sigma^{2}_x},</math>
 
Äärellisen joukon <math>x_1,x_2,\ldots,x_n</math> keskihajonta on
:<math>\sigma = \sqrt{\frac{\sum\limits_{i=1} ^{n} (x_{i} - \overline{x})^2}{n}}</math>,
missä
:<math>\bar{x} = \frac1n\sum\limits_{i=1}^n x_i = \frac{(x_1+\cdots+x_n)}{n}</math>,
on kyseisen joukon keskiarvo.
 
:<math>\sigma = \sqrt{\frac{\sum\limits_{i=1} ^{n} (x_{i} - \overline{x})^2}{n}}</math>, missä <math>\bar{x} = \frac1n\sum\limits_{i=1}^n x_i = \frac{(x_1+\cdots+x_n)}{n}</math> on kyseisen joukon keskiarvo.
==Otoskeskihajonta==
 
missä ''X'' on [[satunnaismuuttuja]] ja ''μ'' on sen [[odotusarvo]]. Keskihajonta on siis varianssin neliöjuuri. Keskihajonta kuvaa keskimääräistä poikkeamaa odotusarvosta. Sen etuEtuna varianssiin verrattuna on, että senähden on helppotulkinnan tulkitahelppous, koskasillä keskihajonnan asteikko vastaa mittausten asteikkoa.
 
=== Otoskeskihajonta ===
Otoksen <math>(y_1,\dots,y_n)</math> keskihajonnan harhaton estimaatti eli [[otoshajonta]] on
 
Rivi 25 ⟶ 32:
 
Jos käytettävissä olisi joukon ''Y'' todellinen keskiarvo eikä vain otoksesta <math>y_1,y_2,\ldots,y_n</math> laskettua otoskeskiarvoa <math>\overline{y}</math>, nimittäjässä pitäisi olla ''n'' kuten yleensäkin [[keskihajonta|keskihajonnan]] kaavassa.
 
=== Kvantiili ===
Kvantiilit ovat satunnaismuuttujan kertymäfunktiolta säännöllisin välein poimittuja prosenttipisteitä. Jakamalla järjestetty aineisto ''q'' kappaleeseen yhtä suuria joukkoja saadaan ''q''-kvantiili. Kvantiilit ovat aineiston arvoja luokkien rajalla. Näin ollen ''k'':nnes kvantiili on sellainen arvo ''x'', että todennäköisyys saada pienempi arvo kuin ''x'' on noin ''k/q''. Empiirisessä työssä kvantiilit lasketaan aineiston kertymäfunktiosta.
 
=== Variaatiokerroin ===
Variaatiokerroin on hajontaa kuvaava suhdeluku eli hajontaluku, joka ei ole mittayksikköön sidottu. Variaatiokertoimen avulla voi vertailla kahden eri mitta-asteikolla mitatun jakauman hajontoja. Variaatiokerroin on määritelty keskihajonnan ja keskiarvon osamääränä.
 
== Katso myös ==