Tekstinlouhinta tarkoittaa tietokoneavusteista uuden informaation tuottamista suurista määristä tekstiä.[1][2] Tekstinlouhinnassa käytetään usein rakenteellisia tekstejä, koska tietokoneen on helpompi käsitellä niitä[3], mutta edistyneillä koneoppimismenetelmillä on mahdollista käsitellä myös rakenteetonta tekstiä. Uutta tietoa saadaan, kun löydetään teksteistä säännönmukaisuuksia esim. luokittelemalla, klusteroimalla tai jollakin muulla automatisoidulla menetelmällä.[3]

Lähteet muokkaa

  1. Marti Hearst: What Is Text Mining? people.ischool.berkeley.edu. Viitattu 28.2.2023.
  2. What is Text Mining? | IBM www.ibm.com. Viitattu 28.2.2023. (englanniksi)
  3. a b Hotho, A., Nürnberger, A. and Paaß, G. (2005). "A brief survey of text mining". In Ldv Forum, Vol. 20(1), p. 19-62. https://doi.org/10.21248/jlcl.20.2005.68