Intelin puheentunnistusohjelma lukee huulilta

Projektin lähdekoodi vapaaseen jakoon
Intelin puheentunnistusohjelma lukee huulilta

Intel on julkaissut ohjelman, joka parantaa puheentunnistuksen tarkkuutta huulilta lukemisen tekniikalla. Audio Visual Speech Recognition (AVSR) -ohjelma seuraa puhujan suun ja kasvon liikkeitä ja yhdistää ne puheen tuottamaan ääneen. Näin puhekomentoja voi käyttää meluisissakin ympäristöissä, kuten julkisissa tiloissa, joissa pelkkä puheentunnistus muuttuu epäluotettavaksi. Tutkimusprojekti on osa avoimen lähdekoodin periaatteella toimivaa Opencv-hanketta, joten uudenlaisen puheentunnistuksen tekniikka on vapaasti tutkijoiden nähtävillä.

Puhetta ymmärtävien tietokoneiden tulosta on puhuttu aivan vakavissaankin jo vuosikausia. Hankkeet ovat kuitenkin aina kaatuneet rajoitettuun prosessoritehoon ja puheentunnistusohjelmien puutteisiin. Molemmilla saroilla on kuitenkin tapahtunut selvää edistystä. Tavallisissa tietokoneissa alkaa ensimmäistä kertaa olla sen verran ylimääräistä tehoa, että siitä voi huoletta lohkaista osan puheentunnistuksen käyttöön. Lisäksi puheentunnistusohjelmat ja niiden liitokset käyttöjärjestelmiin ja muihin sovelluksiin ovat parantuneet.

Intelin lisäksi muutkin yrittävät parantaa puheentunnistuksen tehoa kuvamateriaalin avulla. Esimerkiksi Microsoftin tutkimusosasto kehittää ohjelmistoa, jolla käyttöjärjestelmän peruskomentoja voisi antaa puhekomentojen ja käsieleiden yhdistelminä.

Tagit: -
Lähetä Tulosta Tilaa RSS-syöte
Takaisin ylös

Lukijoiden kommentit 0 kommenttia

Kirjaudu sisään kommentoidaksesi.
Takaisin ylös
Takaisin ylös
RSS

Uutiset

TTL ry
Pieni kirjapuoti
Takaisin ylös