Molekyylien karsinogeenisuutta ennustavat neuroverkot

Molekyylien karsinogeenisuutta ennustava neuroverkko on neuroverkko, joka ottaa syötteenä jonkin molekyylin ja antaa tulosteena tiedon siitä, onko syötetty molekyyli karsinogeeni vai ei. Molekyylien karsinogeenisuutta ennustavan neuroverkon voi tehdä käyttäen monta eri neuroverkkotyyppiä. Eri neuroverkkotyyppejä, joita tutkimusaiheeseen on sovellettu, näkyvät seuraavasti: graafineuroverkko, metaluokitteluneuroverkko, kapselineuroverkko, laskuripropogaationeuroverkko ja konvolutionaalineuroverkko.[1][2][3][4][5][6][7]

Tieteelliset artikkelit muokkaa

Keskeisiä tutkimusaiheen tieteellisiä julkaisuja ovat muun muassa CapsCarcino, CarcinoPred-EL ja DeepCarc. Näistä parhaan tarkkuuden (engl. accuracy) saavuttivat CapsCarcino (85.0 %) ja DeepCarc (90.9 %). Tarkkuus eli ACC on suure, jolla mitataan neuroverkkojen suoriutumista. Tarkkuuden määritelmä on oikeiden positiivien (engl. true positive) ja oikeiden negatiivien (engl. true negative) summan suhde oikeuden positiivien, oikeiden negatiivien, väärien negatiivien (engl. false negative) ja väärien positiivien (engl. false positive) summaan. Tarkkuus on keskiarvo kahdesta muusta suureesta, jotka ovat spesifisyys (engl. specificity, lyhenne SP) ja sensitiivisyys (engl. sensitivity, lyhenne SE). Spesifisyyden määritelmä on oikeiden negatiivien suhde väärien positiivien ja väärien negatiivien summaan. Taas sensitiivisyys tarkoittaa oikeiden negatiivien suhdetta oikeiden positiivien ja väärien negatiivien summaan.[1][2][3][4][5][6][7]

Molekyylien esitystavat muokkaa

Jotta molekyylejä voidaan syöttää neuroverkon syötekerrokseen, on ne muutettava molekyylisormenjälkijärjestelmien esitysmuotoihin kuten MACCS-esitysmuotoihin.[1][2][3][4][5][6][7]

 
 

Aineistot muokkaa

Yleisin lähde, josta tieteelliset artikkelit ovat noutaneet aineistonsa, on CPDB eli Carcinogen Potency Database. Yleisin aineistokoko tieteellisissä artikkeleissa on noin tuhat molekyyliä.[1][2][3][4][5][6][7]

 

Lähteet muokkaa