Tesseract (ohjelmisto)

Tesseract on tekstintunnistusohjelmisto eri käyttöjärjestelmille. Se on ilmainen ohjelmisto, joka on julkaistu vapaan Apache-lisenssin alaisena.

Ohjelmistoa kehitti alun perin Hewlett-Packardin tutkimuslaboratorio Bristolissa Isossa-Britanniassa ja Greeleyssa Coloradossa USA:ssa vuosien 1985–1994 välillä. Vuonna 1996 ohjelmisto siirrettiin Windowsille ja C++-kielelle 1998. Vuonna 2005 HP julkaisi Tesseractin avoimena lähdekoodina. Vuodesta 2006 marraskuuhun 2018 sitä kehitti Google.[1]

Tesseract on perustaltaan komentoriviohjelma. Sille on graafisia käyttöliittymiä, esimerkiksi gImageReader Windowsille, OCRFeeder Linuxille ja PDF OCR X macOS:lle.[2]

Lähteet muokkaa