Ero sivun ”Bayesiläinen tilastotiede” versioiden välillä

[arvioimaton versio][arvioimaton versio]
Poistettu sisältö Lisätty sisältö
w
Rivi 1:
'''Bayesiläinen tilastotiede''' on frekventistisen (l.eli klassisen) tilastotieteen ohella [[tilastotiedeTilastotiede|tilastotieteen]] toinen suuri [[paradigma]]. Bayesiläinen tilastotiede perustuu [[Bayesin teoreema|Bayesin kaava]]n P(A|B) = P(B|A)P(A) / P(B) soveltamiseen.
 
== Bayesiläiset menetelmät ==
Rivi 7:
Bayesiläinen tilastotiede on tyypillisesti mallintavaa (engl. ''modelling'', ''inferential''), ei siis deskriptiivistä tilastotiedettä. Se pyrkii erilaisiin havaintoaineistoihin sisältyvän satunnaisvaihtelun selittämiseen ja analysointiin edistyneiden laskennallisten menetelmien avulla.
 
Bayesiläisessä tilastotieteessä laskujen ratkaisemiseen joudutaan usein käyttämään tietokoneella tehtäviä ns.niin sanottuja [[Monte Carlo -simulaatio]]ita. Nykyään on kuitenkin käytettävissä valmisohjelmistoja, joiden avulla simulaatiomenetelmiä voidaan soveltaa monissa tapauksissa ilman, että ne joudutaan ohjelmoimaan joka kerta uudelleen.
 
== Peruskäsitteet ==
 
[[Thomas Bayes|Bayesin]] kaavan P(A|B) = P(B|A)P(A) / P(B) tapahtumat A ja B voisivat esimerkiksi olla seuraavia väitelauseita: A = "Suomalaiset”Suomalaiset miehet ovat pitempiä kuin ruotsalaiset"ruotsalaiset” ja B = "Kun”Kun tutkitaan 5 suomalaista ja 5 ruotsalaista, kaikki ruotsalaiset ovat pidempiä"pidempiä”. Bayesiläisessä tilastotieteessä voidaan tällöin tehdä laskelmia siitä ''todennäköisyydestä että A on totta'', kun B havaitaan.
 
Klassisessa tilastotieteessä edellisen esimerkin kaltainen päättely on kielletty. Tämän paradigman mukaan parametrit (kuten esimerkin populaatiokeskiarvot), ovat kiinteitä lukuja, eikä niille voida määrätä mielekästä todennäköisyystulkintaa.
Rivi 21:
== Paradigman edut ja haitat ==
 
Käytettäessä ei-havaittavalle muuttujalle ns.niin sanottua ''laakeaa prioria'' p(x) ~ 1 (engl. ''uniform prior'', tulkitaan singulaarisesti jatkuvana mittana, joka saa saman arvon kaikilla x), posteriori p(x|y) on vakiokerrointa vaille sama kuin klassisessa tilastotieteessä käytettävä uskottavuusfunktio. Tällöin bayesiläiset menetelmät antavat samoja numeerisia tuloksia, kuin ''maximum likelihood'' -päättely, joskin tulosten käsitteellinen tulkinta on erilainen.
 
Jos käytetään jotakin muuta kuin laakeaa prioria, posteriorin arvot muuttuvat. Tästä syystä priorin valinta saattaa vaikuttaa bayesiläisen tilastollisen päättelyn tuloksiin. Bayesiläiset tilastotieteilijät jakautuvat ns.niin sanottuihin ''subjektiivisiin bayesiläisiin'', jotka korostavat priorin merkitystä tilastollisen päättelyn hyödyllisenä apuvälineenä, ja ''objektiivisiin bayesiläisiin'', jotka suhtautuvat varauksellisesti prioriin sisältyvään informaatioon.
 
Jotkut tilastotieteen klassisen paradigman kannattajat ovat esittäneet, että priorin ja posteriorin käsitteet ovat ontologisesti ongelmallisia, tai peräti kokonaan virheellisiä. Toisaalta bayesiläistä paradigmaa on puolustettu informaatio- ja päätösteoreettisilla perusteluilla. Monien kannattajiensa mielestä bayesiläinen paradigma antaa tilastotieteelle teoreettisen perustan, joka on yhtenäisempi ja helpommin omaksuttava, kuin klassisen paradigman antama perusta.