Ero sivun ”Kausaliteetti” versioiden välillä

[katsottu versio][katsottu versio]
Poistettu sisältö Lisätty sisältö
Rivi 30:
Oletetaan että populaatio koostuu yksilöistä <math>u</math>. Yksilöille suoritettavia mahdollisia käsittelyjä S on kaksi: kontrolliryhmä <math> (S=c) </math> ja käsittelyryhmä <math> (S=t) </math>. Kokeellisessa tutkimuksessa tutkija voi kontrolloida kumpaan ryhmään kukin yksilö joutuu, havainnoivassa tutkimuksessa ryhmä määräytyy muista, ulkopuolisista tekijöistä. Rubinin kausaalimallissa oleellista on, että jokainen yksilö voidaan altistaa mille tahansa käsittelylle. Tai siis arvo <math>S(u) </math> olisi voinut olla erilainen jokaiselle yksilölle <math>u</math>.<ref name=rubin>{{Verkkoviite | Osoite=http://www.nyu.edu/classes/shrout/G89-2247/statisticscausal.pdf | Tekijä=Holland, Paul W. | Nimeke=Statistics and Causal Inference | Julkaisija=''Journal of American Statistical Association'', December 1986, Vol 81, No 396, Theory and Methods | Kieli ={{en}} }}</ref>
 
Vastemuuttujan tehtävä on mitata valitun käsittelyn vaikutusta. Potentiaalisia vasteita on kaksi, <math>Y_t</math> ja <math>Y_c</math>, riippuen käsittelystä <math>S</math>. Merkitään yksilön <math>u</math> potentiaalisia vasteita <math>Y_t(u)</math> ja <math>Y_c(u)</math>, missä <math>Y_t(u)</math> on vaste, joka olisi havaittu, jos yksilö <math>u</math> olisi altistettu käsittelylle <math>t</math>. Vastaavasti Y<sub>c</submath>Y_c(u)</math> on arvo, joka olisi havaittu samalta yksilöltä <math>u</math>, jos se olisi altistunut käsittelylle <math>c</math>. Yksilöltä havaitaan kuitenkin vain toinen potentiaalisista vasteista, havaitsematonta vastetta kutsutaan kontrafaktuaaliksi.<ref name=rubin/>
 
Käsittelyn <math>t</math> kausaalivaikutus suhteessa kontrolliin <math>c</math> yksilölle <math>u</math> on erotus <math>Y_t(u) - Y_c(u)</math>.<ref name=rubin/>
 
=== Kausaalipäättelyn perusongelma ===
Rivi 38:
Erotusta <math>Y_t(u) - Y_c(u)</math> ei voida sellaisenaan käyttää kausaalivaikutuksen laskemiseksi, koska molempia arvoista <math> Y_t(u) </math> ja <math>Y_c(u)</math> ei voida havaita. Samalta yksilöltä on mahdoton mitata molempia vasteita. Ongelmalle voidaan esittää kaksi yleistä ratkaisua.
 
Tieteellinen ratkaisu on olettaa ajallinen stabiilius, jolloin vaste ei riipu käsittelyn ajankohdasta tai aiemmista käsittelyistä. Tällöin voidaan mitata sekä <math> Y_t(u) </math> että <math>Y_c(u)</math> yksilöltä <math>u</math>. Toinen vaihtoehto on olettaa yksilöiden homogeenisuus, jolloin kausaalivaikutus voidaan laskea erotuksena <math> Y_t(u_1) - Y_c(u_2)</math> kahden eri yksilön vasteita käyttäen.
 
Tilastotieteellisessä ratkaisussa tarkastellaan keskimääräistä kausaalivaikutusta <math> T = E(Y_t - Y_c) = E(Y_t) - E(Y_c) </math>. Kuitenkaan yleisesti yhtäsuuruus <math> E(Y_t) = E(Y_t|S=t) </math> ei päde. Tai siis koko populaatiosta laskettu keskiarvo poikkeaa keskiarvosta, joka lasketaan käsittelyyn <math>t</math> joutuneiden yksilöiden yli. Yhtäsuuruus pätee, jos yksilöt on jaettu satunnaisesti käsittelyryhmiin, mikä voidaan varmistaa ainakin kokeellisessa tutkimuksessa. Tällöin prima facie kausaalivaikutuksella
<math> T_{PF} = E(Y_t|S=t) - E(Y_c|S=c) </math> voidaan estimoida kiinnostavaa kausaalivaikutusta <math>T</math>.
 
== Pearlin kausaalimalli ==