Avaa päävalikko

Arvi Johannes Hurskainen (s. 25. tammikuuta 1941 Kitee) on suomalainen Afrikan kielten ja kulttuurien sekä kielitieteen tutkija. Hurskainen työskenteli Afrikan tutkimuksen professorina Helsingin yliopiston Aasian ja Afrikan kielten ja kulttuurien laitoksella vuosina 1989–2006. Kiinnostus bantukieliin, erityisesti swahilin kieli ja sen murteiden tutkimukseen, johdatti Hurskaisen kielten tutkimuksen ja erityisesti kieliteknologian pariin. Vuodesta 1985 alkaen hän on keskittynyt yhä enemmän tietokoneella suoritettuun kielen kuvaukseen ja analysointiin. Alkaen eläkkeelle jäämisestään vuonna 2006 hän on paneutunut kieliteknologiaan kokopäiväisesti.

Arvi Hurskainen
Arvi Hurskainen vuonna 2002
Arvi Hurskainen vuonna 2002
Henkilötiedot
Syntynyt 25. tammikuuta 1941 (ikä 78)
Kitee
Kansalaisuus suomi
Koulutus ja ura
Instituutti Helsingin yliopisto
Tutkimusalue kielitiede kieliteknologia
Tunnetut työt SALAMA, kieliteknologian kehitysympäristö;
Helsinki Corpus of Swahili 2.0;
Nordic journal of African Studies, aloitteentekijä ja ensimmäinen päätoimittaja.

Sisällysluettelo

ElämäkertaMuokkaa

Vanhemmat maanviljelijä Eino Hurskainen (1906–1978) ja Siviä o.s. Pekkinen (1909–1982). Valmistui ylioppilaaksi Joensuun lyseosta vuonna 1960. Valmistui teologian maisteriksi Helsingin yliopistosta vuonna 1964 ja vihittiin papiksi 1965 Mikkelin tuomiokirkossa.[1] Valmistui filosofian lisensiaatiksi Helsingin yliopistosta 1980 ja väitteli filosofian tohtoriksi vuonna 1984 antropologiaa käsittelevällä teoksella Cattle and Culture. The Structure of a Pastoral Parakujo Society.[2] Ennen täystoimiseen tutkimustyöhön siirtymistään toimi vuosina 1967–1976 lähetystyössä Tansaniassa Suomen Lähetysseuran palveluksessa.

Työhistoria opetuksen ja tutkimuksen parissaMuokkaa

Vuonna 1976 Arvi Hurskainen toimi tutkijana Suomen Akatemian rahoittamassa Jipemoyo-projektissa Tansaniassa, Länsi-Bagamoyon piirikunnassa ja vuodet 1977–1980 Suomen Lähetysseuran palveluksessa Helsingissä.

Vuonna 1981 Hurskaisesta tuli Helsingin yliopiston bantukielten vanhempi lehtori, mitä työtä hän teki vuoteen 1989. Välillä hän kuitenkin toimi vuoden ajan Tumaini-yliopistossa Tansaniassa vuosina 1984–1985. Vuosina 1989–1991 hän toimi Helsingin yliopiston Afrikan kielten ja kulttuurien vt. professorina, ja vuodesta 1991 alkaen professorina. Aasian ja Afrikan kielten ja kulttuurien laitoksen johtajana Hurskainen toimi vuodet 1999–2001. Hän jäi eläkkeelle vuonna 2006.

Hän johti vuosina 1988–1992 ulkoministeriön rahoittamaa tutkimushanketta Swahili Language and Folklore, johon osallistui myös useita tutkijoita Swahilin tutkimusinstituutista Dar-es-Salaamin yliopistosta. Tutkimusyhteistyön tuloksena syntyi äänitetty puhekorpus DAHE (Dar-es-Salaam - Helsinki), joka on myöhemmin digitoitu ja jonka saattaminen Internetiin on valmisteilla.

Vuodesta 1967 vuoteen 1985 Hurskainen työskenteli yhteensä kahdeksan vuoden ajan tutkimus- ja opetustyössä eri osissa Tansaniaa, muun muassa Tukuyussa, Njombessa ja Arushassa Tumaini-yliopistossa, Makumiran kampuksella.[3]

Viranhoidon lomassa Hurskainen on saanut tutkimustyötä varten virkavapauksia. Itä-Afrikkaan suuntautuneet tutkimusmatkat ovat olleet mahdollisia pääasiassa Suomen Akatemian ja Suomen opetusministeriön sekä Suomen ulkoministeriön taloudellisella tuella.

Vuonna 2008 Hurskainen työskenteli vierailevana professorina Makerere-yliopistossa Ugandassa, Kampalassa. Hän piti muun muassa intensiivikursseja kieliteknologiasta ja ohjasi kieliteknologian alan väitöskirjatöitä. Väitöskirjaohjaus jatkui Suomesta käsin aina vuoteen 2013 saakka.

Hurskainen on tehnyt uransa aikana laajaa kansainvälistä yhteistyötä eri yliopistojen kanssa paitsi Afrikassa myös EU:ssa. EU-yhteistyön pohjana oli Afrikan tutkimuksen alan työntekijöiden ja opiskelijoiden keskinäinen vaihto-ohjelma. Tämän työn tuloksena syntyi koulutusohjelma CAMEEL (European Master's Degree in Computer Applications on Modern Extra-European languages). Tärkeimpinä yhteistyökumppaneina voidaan mainita:

  • Napolin yliopisto Italiassa
  • Leipzigin yliopisto Saksassa
  • Uppsalan yliopisto Ruotsissa
  • Norjan tieteen ja teknologian yliopisto Trondheimissa Norjassa
  • Groeningenin yliopisto Hollannissa

KieliteknologiaMuokkaa

Arvi Hurskainen on kehittänyt kieliteknologiaa käyttäen avuksi kielen tarkkaa analysointia. Kielen peruskuvaus tehdään soveltaen päättyväistilaisten automaattien menetelmää kielen morfologisessa analyysissa. Sanat kootaan sen morfeemeista (esim. prefikseistä, suffikseista ja sanavartaloista. Kielenkuvausta yksinkertaistetaan liitämällä siihen morfofonologisia sääntöjä, joiden avulla selvitetään poikkeavuudet morfeemien rajoilla. Tämän standardiksi muodostuneen kielenkuvauksen kehitti ensimmäisenä Kimmo Koskenniemi.
Yksittäisten sanojen kuvauksen jälkeen suoritetaan disambiguointi[4] eli valitaan sanan oikea tulkinta lauseen kontekstin avulla. Tässä yhteydessä suoritaan myös lauseen syntaktinen analyysi. Disambiguoinnissa ja syntaktisessa analyysissa on käytetty Fred Karlssonin alun perin ideoimaa ja Connexorin[5] kehittämää kehitysympäristöä CG3 (Constraint Grammar 3).

Tämä kieliteknologian peruspaketti on tarjonnut mahdollisuuden sellaisten sovellusten kehittämiseen kuin oikeinkirjoituksen tarkistin[6] ja korpustekstien annotointi.[7] Lisäksi voidaan kehittää edistyneitä sanakirjoja[8] ja kielen oppimisjärjestelmiä[9] sekä tuottaa eritasoisia sanastoja kielenoppijoille.[7] Hurskainen onkin koonnut kaksi annotoitua[10] eli analysoitua swahilinkielistä tekstikorpusta Helsinki Corpus of Swahili 1.0 ja sen laajennettu ja kehittyneempi versio Helsinki Corpus of Swahili 2.0.[11]

Korkeatasoinen kielen analyysiohjelma tarjoaa myös hyvän pohjan kielen kääntämiselle. Moduulipohjaisen menetelmän avulla kieltä käännetään asteittain kohdekielelle ottaen huomioon monisanaiset ilmaisut, semanttisen disambiguoinnin[4] ja kohdekielen pintamuotojen tuottamiseen tarvittavat säännöt. Eri vaiheita toteutetaan käyttäen kuhunkin vaiheeseen parhaiten soveltuvia menetelmiä ja kehitysympäristöjä. Tällaisia ovat muun muassa CG3, Beta sekä soveltuvat ohjelmointikielet, kuten Perl.

Hurskainen on kehittänyt käännösohjelmia kielipareille swahili -> englanti, englanti -> swahili ja englanti -> suomi.[8]

Tuorein Hurskaisen tutkimuksen kohde on globaalin käännösjärjestelmän kehittäminen käyttäen normalisoitua englantia interlinguana. Idean taustalla on havainto, että kun kääntää tekstiä esimerkiksi swahilista englannin kautta suomeen, koneella tehty käännöstulos on usein parempi kuin jos kääntää saman tekstin nykyenglannista suomeen. Nykyenglanti on kulunut kieli, joka jättää pois relatiivipronomineja sekä konjunktioita sivulauseen alussa. Englanti ei myöskään merkitse transitiivi- ja intransitiiviverbien eroja. Tämä aiheuttaa suuria ongelmia konekääntämisessä. Kun kääntäminen aloitetaan kielestä, jossa kaikki nämä piirteet merkitään, tämä tieto voidaan siirtää englannin kautta kolmanteen kieleen ja tuloksena on kelvollinen käännös.

Hurskaisen kehittämällä sääntöpohjaisella menetelmällä on yhtäläisyyksiä muiden sääntöpohjaisten kehitysympäristöjen kanssa. Sellaisia ovat mm. Grammatical Framework[12] ja Nooj.[13]. Sääntöpohjaisten kieliteknologian menetelmien on todettu olevan erityisen soveliaita sellaisiin kieliin, joilla on vähän kieliresursseja ja jotka ovat morfologisesti kompleksisia.[14].

TuotantoaMuokkaa

VerkkoaineistojaMuokkaa

  • SALAMA,[15] vuonna 1985 toimintansa aloittanut ja jatkuvasti etenevä kieliteknologinen kehitysympäristö erilaisten kieliin liittyvien sovellusten kehittämiseksi.

Tällä hetkellä on saatavana 44 teknistä raporttia muun muassa kielenkäännöksestä englanti-swahili-englanti ja englanti-suomi.[16]


Ladattavat pdf-muotoiset raportitMuokkaa

SovellusohjelmiaMuokkaa

Painettuja teoksiaMuokkaa

  • Cattle and Culture. The Structure of a Pastoral Parakujo Society. Väitöskirja, Helsingin yliopisto. Studia Orientalia 56,[17] Helsinki 1984. ISBN 51-95076-7-1
  • Swahilin peruskurssi. Gaudeamus, Helsinki 1989. ISBN 951-662-485-5
  • Dialect specific Dictionary of Kae (Makunduchi). Haji Chum’in kanssa, Department of Asian and African Studies, Helsinki 1993.
  • Afrikan kulttuurien juuret. Ari Siiriäisen kanssa, Tietolipas 134 SKS,[18] Helsinki 1995. ISBN 951-717-822-0
  • Swahilin peruskurssi. Toinen, uudistettu painos, Suomen itämainen seura, Helsinki 2000.
  • Swahilin peruskurssi. Kolmas, uudistettu painos, Suomen itämainen seura, Helsinki 2003.

ToimitustöitäMuokkaa

  • Nordic Journal of African Studies (NJAS).[19] Pohjoismainen tieteellinen aikakauskirja Afrikan tutkimuksesta. Aloitteen tekijä ja ensimmäinen päätoimittaja 1992–2006.
  • Social Science and Conflict Analysis. Mohamed Salih’in kanssa, Helsingin yliopiston Aasian ja Afrikan kielten ja kulttuurien laitos sekä Scandinavian Institute of African Studies, Uppsala 1993.

LuottamustehtäviäMuokkaa

  • Suomen Antropologinen seura, johtokunnan jäsen 1990–2000
  • International African Institute (Lontoo, Iso-Britannia),[20] johtokunnan jäsen 1991–2005;
  • Nordic Association of African Studies, aloitteen tekijä ja puheenjohtaja 1991–;
  • Nordic Journal of African Studies, päätoimittaja 1992–2006;
  • Kiswahili (Journal of the Institute of Kiswahili Research, Dar-es-Salaam, Tansania) toimitusneuvoston jäsen 1991–
  • Archives of Popular Swahili ja Journal of Language and Popular Culture in Africa (Amsterdam, Hollanti), neuvottelukunnan jäsen 1999–;
  • Suomen itämainen seura, johtokunnan jäsen 1998–
  • Studia Orientalia -julkaisusarjan toimituskunnan jäsen 1998–
  • Special Interest Group for Language and Speech Technology Development (Pretoria, Etelä-Afrikka), jäsen 1999–
  • Orientalistiska Studier i Svenska Högskoleverket (Tukholma, Ruotsi), arviointitoimikunnan jäsen 2003–2004.

HuomionosoituksiaMuokkaa

LähteetMuokkaa

  1. Suomen teologit 1999. Lahti: Suomen kirkon pappisliitto, 1999. ISBN 952-91-0905-9.
  2. Suomen professorit 1640–2007. Jyväskylä: Professoriliitto, 2008. ISBN 978-952-99281-1-8.
  3. Tumaini University Makumira Tumaini University. Viitattu 16.04.2018.
  4. a b Kielitiede:disambiguointi Tieteen termipankki. Viitattu 16.04.2018.
  5. Natural Knowledge Connexor. 2011–2016. Viitattu 16.04.2018.
  6. Zana za Uhakiki za Microsoft Office 2013 – Swahili Microsoft. Viitattu 16.04.2018.
  7. a b c Hurskainen, Arvi: Tagger 77.240.23.241. Viitattu 16.04.2018.
  8. a b Hurskainen, Arvi: Translator 77.240.23.241. Viitattu 16.04.2018.
  9. Hurskainen, Arvi: Learn Swahili 77.240.23.241. Viitattu 16.04.2018.
  10. Kielitiede:annotaatio Tieteen termipankki. Viitattu 16.04.2018.
  11. Hurskainen, Arvi: Helsinki Corpus of Swahili 2.0 (HCS 2.0) Metashare.csc.fi. 9.5.2014. Viitattu 3.3.2019.
  12. GF – Grammatical Framework - A programming language for multilingual grammar applications GF – Grammatical Framework. Viitattu 16.04.2018.
  13. A Linguistic Development Environment NooJ. Viitattu 16.04.2018.
  14. Hurskainen, Arvi. 2018. Sustainable language technology for African languages. In Agwuele, Augustine and Bodomo, Adams (eds), The Routledge Handbook of African Linguistics, 359-375. London: Routledge Publishers. ISBN: 978-1-138-22829-0
  15. a b Hurskainen, Arvi: Welcome to Salama 77.240.23.241. ”Salama (Swahili Language Manager) is an environment for language technology applications. All applications in Salama make use of rule-based language technology, started in 1985.” Viitattu 25.6.2018.
  16. Hurskainen, Arvi: Technical reports on LT Salama - Swahili Language Manager. Viitattu 25.6.2018.
  17. Studia Orientalia Suomen Itämainen Seura. Viitattu 3.3.2019.
  18. Hurskainen, Arvi & Siiriäinen, Ari: Afrikan kulttuurien juuret SKS verkkokauppa. Viitattu 25.06.2018.
  19. Häkkinen, Anne: Nordic Journal of African Studies - General information Nordic Journal of African Studies. 1.3.2004. Viitattu 25.06.2018.
  20. International African Institute IAI Home. Viitattu 25.6.2018.
  21. Studia Orientalia Suomen Itämainen Seura - Finnish Oriental Society. Viitattu 25.06.2018.

Aiheesta muuallaMuokkaa

  • Arvi Hurskainen Suomen Uskontotieteellinen Seura ry. 2018. Viitattu 14.7.2018.