Ero sivun ”Data-analyysi” versioiden välillä

[arvioimaton versio][katsottu versio]
Poistettu sisältö Lisätty sisältö
Lisätty tietoa data-analyysin eri vaiheista, sovellusaloista ja ohjelmista.
Elve (keskustelu | muokkaukset)
p tyyliä korjattu.
Rivi 38:
* visualisointi
 
* [[korrelaatio]]t
* [https://fi.wikipedia.org/wiki/Korrelaatio korrelaatiot]
 
* [[Yleistetty lineaarinen malli|yleistetty lineaarinen malli (regressio)]]
* [https://fi.wikipedia.org/wiki/Yleistetty_lineaarinen_malli regressio]
 
* ennustaminen
Rivi 49:
Datan visuaalinen tarkastelu on usein tehokasta analyysiä. Aineiston kiinnostavista muuttujista saa hyvän kuvan piirtämällä hajontakuvion. Piirtämällä histogrammilla voidaan tarkastella muuttujan jakaumaa. Usean muuttujan välisiä keskinäisiä riippuvuuksia voidaan tarkastella mm. korrelaatiolla ja regressiolla. 
 
[https://fi.wikipedia.org/wiki/Bayesilainen_tilastotiede[Bayesilainen tilastotiede|Bayesilaisessä tilastotieteessä]] analyysin kohteena on parametriavaruus, sillä havaintoavaruus pidetään tunnettuna ja kiinteänä. Siinä sovitetaan todennäköisyysmalli dataan ja lasketaan saadun posteriorijakauman perusteella todennäköisyyksiä.<ref>Gelman Andrew, Carlin John B., Stern Hal S. & Rubin Donald B.: Bayesian Data Analysis. Chapman & Hall/CRC, 1995.</ref> Posteriorijakauman avulla voidaan myös mm. ennustaa tulevia havaintoja. [https://fi.wikipedia.org/wiki/Bayesilainen_tilastotiede Bayesilaisessa tilastotieteessä] pääosassa on [https://fi.wikipedia.org/wiki/Bayesin_teoreema[Bayesin teoreema|Bayesin kaava]].
 
=== Jälkikäsittely ===
Rivi 69:
* Biolääketieteellinen data: laboratoriokokeista saatavaa dataa käytetään analysoimaan, ymmärtämään ja hyödyntämään biologisia prosesseja. Biolääketieteellistä dataa käytetään esim. DNA sekvenssien, geenien ja proteiinien ilmenemisen analysoimiseen tai säätelyverkostojen mallintamiseen.
 
== Ohjelmia data-analyysin tekemiseen ==
Suosittuja ilmaisia ja [https://fi.wikipedia.org/wiki/Avoin_l%C3%A4hdekoodi[Avoin lähdekoodi|avoimen lähdekoodin]] ohjelmia: [https://fi.wikipedia.org/wiki/R_[R (ohjelmisto) |R]], Rapid Miner, WEKA
 
Maksullisia ohjelmia: MATLAB, [[SPSS]], [https://fi.wikipedia.org/wiki/SAS_[SAS (ohjelmisto) |SAS]] ja STATISTICA[[Luokka:Data-analyysi|*]]
 
== {{Link GA|fr}}Lähteet ==
<references />
 
 
[[Luokka:Data-analyysi|*]]
 
{{Link GA|fr}}