Whisper
Tätä artikkelia tai sen osaa on pyydetty päivitettäväksi, koska sen sisältö on osin vanhentunut. Voit auttaa Wikipediaa parantamalla artikkelia. Lisää tietoa saattaa olla keskustelusivulla. Tarkennus: V3 on julkaistu marraskuussa 2023 |
Whisper on OpenAI:n kehittämä automaattinen puheentunnistusjärjestelmä. Whisper on julkaistu lokakuussa 2022. Järjestelmä voi tuottaa tekstiä äänisyötteistä. Whisper on kehitetty 680 000 tunnin monikielisellä verkkoaineistolla. Whisper mahdollistaa käännösversiot 99 kielelle sekä kääntämisen englanniksi.[1][2]
Whisper | |
---|---|
Kehittäjä | OpenAI |
Kehityshistoria | |
Ensijulkaisu | 21. syyskuuta 2022 |
Tiedot | |
Ohjelmistotyyppi | käännössovellus |
Alusta | OpenAI |
Lisenssi | MIT-lisenssi |
Aiheesta muualla | |
Verkkosivusto |
Ominaisuudet
muokkaaWhisperin merkittävin ominaisuus on sen kestävyydessä. Monipuolisen harjoitusaineiston avulla järjestelmä pystyy ymmärtämään ja siirtämään puhetta eri aksenttien välillä. Whisper toimii myös meluisassa ympäristössä. Whisper kykenee kääntämään puhetta useilla eri kielillä. Whisper on toteutettu enkooderi-dekooderi-muuntajana ja se käsittelee syötettyä ääntä 30 sekunnin mittaisina kokonaisuuksina.[3]
Lähteet
muokkaa- ↑ Introducing Whisper OpenAI. 21.9.2022. Viitattu 18.2.2024. (englanniksi)
- ↑ Cochard, David: Whisper : Speech Recognition Model Capable of Recognizing 99 Languages Medium. 13.11.2023. Viitattu 18.2.2024. (englanniksi)
- ↑ Kumar, Akhil: Whisper: A Breakthrough in Automatic Speech Recognition Medium. 10.10.2023. Viitattu 18.2.2024. (englanniksi)