Avaa päävalikko

Syväoppiminen (engl. deep learning) on tekoälyn oppimismenetelmä, jossa hyödynnetään usean kerroksen neuroverkkoja.[1][2]

Syväoppimisen tavoitteena on luoda algoritmin avulla neuroverkko, joka pystyy ratkaisemaan sille annetut ongelmat.[3] Syväoppimista käytetään erityisesti sellaisten ongelmien ratkaisemiseen, joissa perinteisillä menetelmillä tehdyt ratkaisut vaatisivat erittäin monimutkaisia sääntöjä. Syväoppimista käytetään esimerkiksi puheen, kuvien ja tekstien tunnistamiseen tai käsittelyyn.[4]

Sisällysluettelo

HistoriaMuokkaa

Syväoppiminen on edistynyt hyvin nopeasti 2010-luvulla, kun neuroverkkojen algoritmit ovat kehittyneet paremmiksi ja tietokoneiden laskentateho on kasvanut. Varhainen läpimurto saavutettiin lokakuussa 2012, kun kanadalaisen neuroverkkojen kehittäjän Geoffrey Hintonin oppilaat voittivat ImageNet-kuvantunnistuskilpailun ennätystuloksella, ja heidän neuroverkkonsa tunnisti kuvia tuplasti tarkemmin kuin toiseksi sijoittunut kilpaileva tekoäly.[5]

PeriaateMuokkaa

 
Usean kerroksen neuroverkko

Syväoppiminen perustuu keinotekoisiin hermoihin, jotka muodostavat usean kerroksen neuroverkon. Hermot eli neuronit laskevat numeerisen tuloksen yhdestä tai useammasta numeerisesta, muilta neuroneilta tai syötteestä saadusta hermoärsykkeestä, perustuen sisäiseen painoarvoon.[6][7]

Ensimmäisenä neuroverkkon rakenne suunnitellaan ja painoarvot alustetaan. Alustettava painoarvo voi olla neuroneissa ennalta määritetty muuttumaton arvo tai satunnaislukugeneraattorilla arvottu luku.[6][7]

Oppimisessa neuroverkolle syötetään ennalta luokiteltuja näytteitä. Neuroverkon tuottamien arvojen ja näytteen luokittelun perusteella, neuronien painoarvoja muutetaan siten, että neuroverkko tuottaisi syötteen luokittelun mukaisen tuloksen. [6][7]

Käytännön sovelluksiaMuokkaa

Syväoppiminen on vielä uutta, mutta sen odotetaan tulevan käytännön sovelluksiin. Syväoppimisen avulla joidenkin työtehtävien rutiiniluonteisin osa voidaan hoitaa vähintään puoliautomaattisesti, minkä avulla saavutetaan säästöjä. Syväoppimista hyödynnetään jo erityisesti tehtävissä, joissa täytyy ymmärtää puhetta tai kirjoitettua tekstiä, tai tulkita kuvamateriaalia.[5]

Hyvä esimerkki syväoppimisen eduista on kuvantunnistus. Syväoppimisessa ei tarvitse luoda tunnistamiseen vaadittavaa suurta määrää ohjelmallisia sääntöjä. Neuroverkolle vain syötetään suuri määrä luokiteltuja valokuvia halutusta aihepiiristä, ja järjestelmä säätää neuroverkon toimintaa niin, että tunnistustarkkuus paranee kohti maksimia. Esimerkiksi kissat voidaan nykyisin tunnistaa kuvista jo 90 prosentin tarkkuudella. Syväoppiminen myös paranee mitä enemmän ja parempaa dataa järjestelmälle annetaan.[5]

Toinen syväoppimisen sovellus on esineiden poimiminen, joka on aina ollut vaikea opettaa robotille. Syväoppimisen avulla MIT-yliopisto pystyi parantamaan robotin kykyä poimia esineitä pudottelematta.[5]

Terveydenhuollossa syväoppimista testataan auttamaan lääkäreitä diagnosoimaan sairauksia poitilaan terveystietojen ja testitulosten perusteella.[5]

Internetin keskustelupalstoja on mahdollista moderoida koneoppimisen järjestelmillä, ja chat-järjestelmissä niitä voidaan hyödyntää asiakkaiden tiedusteluihin vastaamisessa.[5]

Google on yksi syväoppimisen soveltamisen edelläkävijöistä. Google aloitti syväoppimisen tutkimisen Google Brain -projektillaan vuonna 2011. Seuraavana vuonna yhtiö ilmoitti rakentaneensa neuroverkon, joka toimi 16 000 tietokoneella ja pystyi tunnistamaan kissoja kuvista sen jälkeen kun sille oli näytetty 10 miljoonaa kuvaa. Vuonna 2014 Google osti brittiläisen syväoppimisstartup-yrityksen nimeltä DeepMind. Google on käyttänyt syväoppimista indeksoimiensa kuvien tehokkaampaan luokitteluun ja parantaakseen siten hakutuloksia. Google on käyttänyt menetelmää myös epätäydellisten kuvien täydentämisessä muiden samankaltaisten kuvien pohjalta. Videopalvelussaan Google pystyy luomaan syväoppimisen avulla automaattisia yhteenvetoja ja turvallisuusvaroituksia. Googlen puheentunnistustekoäly käyttää syviä neuroverkkoja oppiakseen ymmärtämään puhuttuja käskyjä ja kysymyksiä. Google Brainiin on sisällytetty myös Googlen käännöspalvelu, ja koko järjestelmä kirjoitettiin uudelleen ja siirrettiin uuteen syväoppimisympäristöön nimeltä Google Neural Machine Translation. Google käyttää syväoppimista myös YouTube-suositustensa parantamiseen: neuroverkot tutkivat kaiken mahdollisen käyttäjien tavoista ja mieltymyksistä ja opettelevat päättelemään, mikä saisi heidät jatkamaan videoiden katselua.[8] Vuonna 2015 Google muutti syväoppimiseen keskittyvän TensorFlow-ohjelmointialustansa avoimeen lähdekoodiin. Googlen robottiauto Waymo on käyttänyt syväoppimisalgoritmeja. Deep Mind tutkii terveydenhuoltoprojekteja, joissa etsitään keinoja havaita silmävammoja ja syöpäkasvaimia aikaisissa vaiheissa.[9]

DeepMind käytti vuonna 2014 "syvää vahvistusoppimista" opettamaan tekoälylle tietokonepelien pelaamista. Menetelmä yhdisti vahvistusoppimisen syvän neuroverkon harjoittamiseen. Vuonna 2016 DeepMindin AlphaGo-ohjelma löi ensimmäisenä maailman parhaat ihmispelaajat lautapeli gossa. AlphaGo yhdisti tavanomaisen tekoälyn logiikan syväoppimisen tuottamaan intuitiiviseen tehoon, joka on gossa erityisen tärkeää. Tuloksena oli ylivoimainen itseoppinut ohjelma, jonka siirtoja on kuvattu yhtä aikaa vahvoiksi ja erittäin intuitiivisiksi.[10] DeepMindin seuraava ohjelma AlphaZero opetteli vuonna 2017 yhdessä vuorokaudessa syviä neuroverkkoja käyttäen pelaamaan shakkia paremmin kuin maailman vahvimmat shakkiohjelmat. Ohjelman menestys perustui sen ihmismäiseen tapaan valikoida siirrot pelkän raa'an laskemisen sijaan.[11]

RajoituksiaMuokkaa

Syväoppiminen ei kykene oppimaan käsitteitä, vaan ainoastaan käsitteiden ilmentymiä. Esimerkiksi videopeliä pelaamaan oppinut neuroverkko saattaa oppia toimimaan tietyllä tavalla, joka voidaan ilmaista yksinkertaisena sääntönä, mutta tämä sääntö ei neuroverkosta ole käytännössä luettavissa. Tässä mielessä syväoppiminen on varsin pinnallista, ja syväoppimisella saatuja tuloksia on helppo hämätä esimerkiksi muuttamalla syötettä siten, että se vain vähän poikkeaa opetuksessa käytetystä datasta. Oppimisen tuloksiin ei myöskään voi tästä syystä luottaa [12].

Kuvantunnistuksessa syväoppimisen on uskottu oppivan kuvissa esiintyviä käsitteitä, kuten 'koira' tai 'kissa', mutta neuroverkon herkkyys pienille kuvan muutoksille, joilla koira saadaankin luokiteltua kissaksi, osoittaa, että tämä ei pidä paikkansa. Lisäksi neuroverkon syvyyden lisääminen ei juurikaan auta luokittelun saamiseksi luotettavammaksi [13].

Syväoppimisen yksi ongelma on se, että tekoäly ei osaa yhdistää asioita kokonaisuuksiin, sillä syväoppimisessa ei ole kokonaisrakennetta, johon tietoja voisi yhdistää. Tästä seuraa vaikeuksia objektien erottamisessa, mikä voi vaikeuttaa esimerkiksi robottiauton kykyä tunnistaa edessään olevia kohteita. Myös puheen ja tekstin tunnistamisessa neuroverkkomallit ovat rajoittuneita, sillä niiden pään sisällä ei ole samanlaista rikasta mallia maailmasta kuin ihmisen päässä. Syväoppiminen vaatii lisäksi ihmisen ohjaamaan oppimista, mikä edellyttää suuren pohjamateriaalin luokittelua.[5]

KehitysMuokkaa

Syväoppimista pyritään kehittämään yhdistämällä siihen ihmisaivojen toiminnasta opittuja tekniikoita, jotta tekoäly pystyisi oppimaan itsenäisemmin ja hahmottamaan ympärillään olevaa maailmaa. Tavoitteena pitkällä tähtäimellä on luoda yleiskäyttöinen tekoäly, joka pystyy hoitamaan itsenäisesti erilaisia tehtäviä. Tämän on arveltu johtavan siihen, että tekoäly vie jopa 30–50 prosenttia nykyisistä työpaikoista parissakymmenessä vuodessa, mikä saattaa aiheuttaa merkittäviä yhteiskunnallisia ongelmia mutta voi toisaalta lisätä tuottavuutta ja kasvattaa elintasoa.[5]

LähteetMuokkaa

  • Tegmark, Max: Life 3.0: Being human in the age of Artificial Intelligence. Allen Lane, 2017. ISBN 978-0-241-23719-9.

ViitteetMuokkaa

  1. Jason Brownlee: What is Deep Learning? Viitattu 23.5.2018. (englanniksi)
  2. Josh Patterson, Adam Gibson: Deep Learning: A Practitioner's Approach, s. 23. , 2017. ISBN 1491914211. Deep Learning: A Practitioner's Approach (viitattu 23.5.2018). (englanniksi)
  3. Deep Learning in a Nutshell – what it is, how it works, why care? Viitattu 10.3.2017. (englanniksi)
  4. technologyreview.com Viitattu 10.3.2017. (englanniksi)
  5. a b c d e f g h Samuli Kotilainen: Tekoälyn vallankumous on alkanut – tätä kaikkea se tarkoittaa Tivi. 17.2.2018. Viitattu 19.5.2018.
  6. a b c Josh Patterson, Adam Gibson: Deep Learning: A Practitioner's Approach, s. 86-104. , 2017. ISBN 1491914211. Deep Learning: A Practitioner's Approach (viitattu 23.5.2018). (englanniksi)
  7. a b c Josh Patterson, Adam Gibson: Deep Learning: A Practitioner's Approach, s. 104. , 2017. ISBN 1491914211. Deep Learning: A Practitioner's Approach (viitattu 23.5.2018). (englanniksi)
  8. Bernard Marr: The Amazing Ways Google Uses Deep Learning AI (1) Forbes. 8.8.2017. Viitattu 20.5.2018.
  9. Bernard Marr: The Amazing Ways Google Uses Deep Learning AI (2) Forbes. 8.8.2017. Viitattu 20.5.2018.
  10. Tegmark 2017, s. 83–88.
  11. Albert Silver: The future is here – AlphaZero learns chess ChessBase. 12.6.2017. Viitattu 20.5.2018.
  12. Gary Marcus: Deep Learning: A Critical Appraisal arxiv 1801.00631. 2.1.2018.
  13. Jason Jo ja Yoshua Bengio: Measuring the tendency of CNNs to Learn Surface Statistical Regularities arxiv 1711.11561.

Aiheesta muuallaMuokkaa