Tilastollinen tunnusluku

otoksen muunnos reaaliluvuksi tai reaalilukujen muodostamaksi vektoriksi

Tilastollinen tunnusluku on otoksen muunnos reaaliluvuksi tai reaalilukujen muodostamaksi vektoriksi. Tunnusluvuksi kutsutaan sekä muunnoksen avulla muodostettua satunnaismuuttujaa että sen saamaa arvoa.[1] Matemaattisesti ilmaistuna tunnusluku on siis kuvaus , missä on otoksen koko ja on tunnusluvun ulottuvuus.

Käyttötarkoituksia muokkaa

Tunnusluvun tarkoituksena on tiivistää otoksen sisältämä informaatio havainnolliseen muotoon, tyypillisesti yhdeksi luvuksi[2]. Tunnuslukuja voidaan käyttää otoksen kuvailuun[3], mutta niille on muitakin käyttötarkoituksia. Muun muassa merkitsevyystestien testisuureet ja tuntemattomien parametrien estimointiin liittyvät estimaattorit ovat tunnuslukuja[4]. Tunnusluvun jakauman määrääminen on yksi tilastotieteen keskeisistä ongelmista[5].

Tavanomaisia tunnuslukuja muokkaa

Yleisimmin käytettyjä tunnuslukuja ovat aineiston sijaintia kuvaavat keskiluvut sekä aineiston vaihteluun liittyvät hajontaluvut[6]. Keskilukuja ovat esimerkiksi aritmeettinen keskiarvo ja mediaani. Hajontalukuihin lukeutuvat muun muassa minimi, maksimi, ala- ja yläkvartiili ja varianssi sekä sen neliöjuuri eli keskihajonta.[3]

Tyhjentävyys muokkaa

Tunnuslukua kutsutaan tyhjentäväksi, jos se sisältää kaiken otoksesta saatavan tiedon. Muodollisesti kyse on siitä, että otoksen yhteisjakauma ehdollistettuna kyseisellä tunnusluvulla ja jakauman parametreilla ei riipu ollenkaan parametreista. Mikäli tunnusluku on kaikista mahdollisista tyhjentävistä tunnusluvuista yksinkertaisin, se on minimaalisesti tyhjentävä. Esimerkiksi otos itsessään on aina tyhjentävä tunnusluku, mutta se ei lainkaan tiivistä otoksesta saatavaa tietoa, joskin joissakin tapauksissa se on silti myös minimaalisesti tyhjentävä tunnusluku. [7]

Graafinen esittäminen muokkaa

Tunnusluvuilla on usein olemassa jonkinlainen graafinen vastine, kuten niin sanottu viiksilaatikko[8].

Käytettäköön esimerkkinä 30 havainnon otosta, joka on saatu R-ohjelmalla simuloimalla havainnot eksponenttijakaumasta parametrin arvolla  . Otoksen havainnot ovat (kolmen desimaalin tarkkuudella) 0.495, 0.121, 2.152, 2.562, 0.074, 1.362, 0.192, 0.042, 0.336, 2.641, 1.257, 2.000, 0.871, 0.517, 0.951, 0.093, 0.340, 0.688, 1.640, 0.443, 0.552, 0.929, 0.818, 2.327, 0.514, 2.092, 0.466, 0.612, 0.187 ja 0.507.

Otoksen minimi  , alakvartiili  , mediaani  , yläkvartiili   ja maksimi  . Tällöin tunnuslukua   vastaa alla oleva viiksilaatikko.

 
Viiksilaatikko simuloidun aineiston pohjalta.

Lähteet muokkaa

  1. Cox, D. R., Hinkley, D. V. (1979): Theoretical Statistics, 18. Chapman and Hall, London.
  2. Lindgren, B. W. (1975): Basic Ideas of Statistics, 88. Macmillan Publishing, New York.
  3. a b Moore, D. S., McCabe, G. P., Craig, B. A. (2009): Introduction to the Practice of Statistics, Sixth Edition, 30–44. W. H. Freeman and Company, New York.
  4. Fisz, M. (1967): Probability Theory and Mathematical Statistics, Third Edition, 425–499. Wiley, New York.
  5. Fisz, M. (1967): Probability Theory and Mathematical Statistics, Third Edition, 337. Wiley, New York.
  6. Lindgren, B. W. (1975): Basic Ideas of Statistics, 89. Macmillan Publishing, New York.
  7. DeGroot, M. H. (1986): Probability and Statistics, Second Edition, 357–367. Addison-Wesley Publishing, Reading.
  8. Moore, D. S., McCabe, G. P., Craig, B. A. (2009): Introduction to the Practice of Statistics, Sixth Edition, 6–22, 36–38. W. H. Freeman and Company, New York.