Tesseract (ohjelmisto)

Tesseract on tekstintunnistusohjelmisto eri käyttöjärjestelmille. Se on ilmainen ohjelmisto, joka on julkaistu vapaan Apache-lisenssin alaisena.

Ohjelmistoa kehitti alun perin Hewlett-Packardin tutkimuslaboratorio Bristolissa Isossa-Britanniassa ja Greeleyssa Coloradossa USA:ssa vuosien 1985–1994 välillä. Vuonna 1996 ohjelmisto siirrettiin Windowsille ja C++-kielelle 1998. Vuonna 2005 HP julkaisi Tesseractin avoimena lähdekoodina. Vuodesta 2006 marraskuuhun 2018 sitä kehitti Google.^[1]

Tesseract on perustaltaan komentoriviohjelma. Sille on graafisia käyttöliittymiä, esimerkiksi gImageReader Windowsille, OCRFeeder Linuxille ja PDF OCR X macOS:lle.^[2]

Lähteet

[1] ttps://github.com/tesseract-ocr/tesseract/blob/main/README.md

[2] ttps://beebom.com/best-ocr-software/

[1]

[2]