Intelin puheentunnistusohjelma lukee huulilta
Intel on julkaissut ohjelman, joka parantaa puheentunnistuksen tarkkuutta huulilta lukemisen tekniikalla. Audio Visual Speech Recognition (AVSR) -ohjelma seuraa puhujan suun ja kasvon liikkeitä ja yhdistää ne puheen tuottamaan ääneen. Näin puhekomentoja voi käyttää meluisissakin ympäristöissä, kuten julkisissa tiloissa, joissa pelkkä puheentunnistus muuttuu epäluotettavaksi. Tutkimusprojekti on osa avoimen lähdekoodin periaatteella toimivaa Opencv-hanketta, joten uudenlaisen puheentunnistuksen tekniikka on vapaasti tutkijoiden nähtävillä.
Puhetta ymmärtävien tietokoneiden tulosta on puhuttu aivan vakavissaankin jo vuosikausia. Hankkeet ovat kuitenkin aina kaatuneet rajoitettuun prosessoritehoon ja puheentunnistusohjelmien puutteisiin. Molemmilla saroilla on kuitenkin tapahtunut selvää edistystä. Tavallisissa tietokoneissa alkaa ensimmäistä kertaa olla sen verran ylimääräistä tehoa, että siitä voi huoletta lohkaista osan puheentunnistuksen käyttöön. Lisäksi puheentunnistusohjelmat ja niiden liitokset käyttöjärjestelmiin ja muihin sovelluksiin ovat parantuneet.
Intelin lisäksi muutkin yrittävät parantaa puheentunnistuksen tehoa kuvamateriaalin avulla. Esimerkiksi Microsoftin tutkimusosasto kehittää ohjelmistoa, jolla käyttöjärjestelmän peruskomentoja voisi antaa puhekomentojen ja käsieleiden yhdistelminä.








