Vinoutunut otos

tilastovirhe

Vinoutunut otos on tilastovirhe, jossa otos on tarpeeksi suuri, mutta ei edusta riittävän tasapuolisesti joukkoa, jota testataan. Vinoutuneen otoksen voi korjata, jos voidaan tehdä uusi testaus ja valita otos paremmin. Tehdyssä testauksessa vinoutuneen otoksen aiheuttamaa tilastovirhettä voidaan selittää tulosten analysoinnissa. Arpomalla osanottajat koe- ja verrokkiryhmiin voidaan välttää otoksen vinoumaa.

Esimerkkejä vinoutuneesta otoksesta muokkaa

  • Yritys tekee tuhat tuotetta ja saa sähköpostitse yhden kehun ja yhdeksän valitusta toimimattomasta tuotteesta. Tämä ei todista, että 90 % tuotteista oli toimimattomia, koska tuhannesta asiakkaasta palautteen antajiksi valikoituu luultavasti lähinnä tyytymättömiä asiakkaita.
  • Ruotsalainen kansanpuolue näyttää voittavan eduskuntavaalit. 80 prosenttia tuoreeseen gallupiin vastanneista ilmoitti äänestävänsä RKP:tä. Gallupissa haastateltiin 3 000 närpiöläistä.
  • Salatut elämät on Suomen suosituin televisio-ohjelma. Selvä enemmistö gallupissa haastatelluista ilmoitti sen lempiohjelmakseen. Gallupissa haastateltiin 10 000 naispuolista peruskoulun yläluokkalaista ja lukiolaista
  • Jäätelökorrelaatio: Päivinä, joina jäätelöä syödään paljon, hukkumisia on enemmän kuin päivinä, joina jäätelöä syödään vähän. Tämä ei todista jäätelön hukuttavan, koska nuo päivät ovat muutenkin erilaisia, muun muassa kuumempia.
  • Itsevalinta: Jos esimerkiksi makkaraa syövillä on muutenkin epäterveellisemmät elintavat ja usein eri sukupuolikin kuin soijaa syövillä, heidän suurempi kuolleisuutensa ei välttämättä johdu puoliksikaan makkarasta. Vikana on "itsevalinta": erilaiset henkilöt ovat valikoineet itsensä makkara- ja soijaryhmiin.

Vinoutuneen otoksen korjaaminen muokkaa

Jos otoksesta puuttuu jokin väestönosa, ei ole keinoa laskea siitä koko väestöä edustavaa estimaattia. Jos jokin ryhmä on vain yli- tai aliedustettu, painottamalla sitä ryhmää otoksessa voidaan korjata tämä ongelma. Otoksen kaikki vinoumat eivät kuitenkaan välttämättä ole tutkijan tiedossa.[1]

Jos esimerkiksi Suomessa on yhtä paljon miehiä ja naisia mutta tutkimukseen hakeutui 20 miestä ja 80 naista, voidaan antaa miehille paino 50/20 = 2,5 ja naisille 50/80 = 0,625.

Voi kuitenkin olla, että jokin muukin tekijä kuin sukupuoli vaikuttaa sekä tutkittavaan asiaan että siihen, ketkä tutkimukseen valikoituivat, eikä tätä virhettä välttämättä osata tunnistaa ja poistaa. Siksi olisi parempi arpoa koko väestöstä tutkimuksen osallistujat, jos se on mahdollista, tai tutkia muuten melko satunnaisesti valikoituneita koe- ja verrokkiryhmiä.

Vinoutuneen otoksen välttäminen muokkaa

Tieteellisissä tutkimuksissa usein ihanteellinen keino poistaa otoksen vinouma on

  • Satunnaistettu koe, jossa arvotaan, ketkä henkilöistä sijoitetaan koeryhmään ja ketkä verrokkiryhmään, joihin koehenkilöitä verrataan. Tällöin kummankin ryhmän pitäisi koostua samanlaisista henkilöistä ja havaittujen erojen pitäisi johtua kokeesta.
    • Kaksoissokkokoe on tästä parannettu versio. Siinä esimerkiksi lääkäri ja potilas eivät kumpikaan tiedä, mitä hoitoa potilaalle on arvottu, esimerkiksi pillerin sisältö. Tällöin ryhmien erot lähes varmasti johtuvat vain hoidon eroista ja sattumasta eikä plasebovaikutuksesta tai muusta.

Usein ei kuitenkaan ole mahdollista tai eettistä satunnaistaa vertailuryhmiä, esimerkiksi arpoa, ketkä pääsevät yliopistoon tai eduskuntaan ja ketkä eivät, tai ketkä altistetaan ydinpommille säteilyn vaikutusten tutkimiseksi. Tähän ratkaisu voi olla suunnilleen yhtä hyvä kuin satunnainen -koejärjestely (as good as random). Seuraavat koetyypit ovat parhaimmillaan tällaisia:

  • Luonnollinen koe: koehenkilöt ja verrokkiryhmä muodostuvat luonnollisesti jonkin tapahtuman johdosta. Esimerkiksi Fidel Castron aiheuttama muuttoaalto Kuubasta Miamiin maahanmuuton työmarkkinavaikutusten tutkimuksessa.[2]
  • Kvasikoe: jokin sääntö jakaa henkilöt ryhmiin.[2]
    • Regressioepäjatkuvuusasetelma (RDD) on esimerkki kvasikokeesta. Vatt tutki eliittilukion vaikutusta koulumenestykseen vertaamalla toisiinsa niitä, joiden keskiarvio oli juuri ja juuri eliittilukion sisäänpääsyrajan ylä- tai alapuolella. Näin pientä eroa voi pitää melko satunnaisena, joten näiden kahden ryhmän voi olettaa olevan riittävän samanlaisia ennen pääsykoetta. Tällaiset kvasikokeelliset asetelmat ovat tuottaneet "uskottavuusvallankumouksen" taloustieteessä viime vuosikymmeninä.[3]

Katso myös muokkaa

Lähteet muokkaa

  1. Cuddeback, Gary (2004). "Detecting and Statistically Correcting Sample Selection Bias". Journal of Social Service Research 30 (3). The Haworth Press, Inc.. doi:10.1300/J079v30n03_02.  (Arkistoitu – Internet Archive)
  2. a b Mikko Forss ja Ohto Kanninen: Miten testata perustulon vaikutuksia? Kenttäkoekulttuurin lyhyt oppimäärä (sivu 21) 2014. Ajatushautomo Tänk. Arkistoitu 3.8.2018. Viitattu 3.8.2018.
  3. Lassi Tervonen, Mika Kortelainen, Ohto Kanninen: Eliittilukioiden vaikutukset ylioppilaskirjoitusten tuloksiin 2017. VATT.
Tämä matematiikkaan liittyvä artikkeli on tynkä. Voit auttaa Wikipediaa laajentamalla artikkelia.