Hakumoottori pureutuu multimediaan

Tiedot irti ääni- ja videotiedostoista
Hakumoottori pureutuu multimediaan

Yleiseurooppalaisessa Sapir-tutkimushankeessa pyritään kehittämään uudenlainen sisällönanalysointi- ja vertaisverkkotekniikoita hyödyntävän video-, ääni- ja multimediatiedostojen hakumoottori.

Eurooppalaisen projektin vetäjäksi on valittu IBM:n tutkimuslaboratorio Israelin Haifassa. IBM on tutkinut kuvien ja videoiden hakusovelluksia jo pitkään omassa Marvel-projektissaan.

Perinteiset avainsanoja tai tekstipohjaisia tunnisteita eli tageja käyttävät hakutekniikat ovat menettämässä käytännön tehoaan sitä mukaa, kun video- ja ääniaineistojen määrä internetissä kasvaa räjähdysmäisellä nopeudella.

Avainsanat eivät riitä

Internetissä julkaistavien aineistojen etsintää ja hyödyntämistä rajoittaa kaksitahoinen ongelma. Multimedia-aineistojen yhteyteen julkaisuvaiheessa syötettävät avainsanat eivät välttämättä kuvaa riittävällä tarkkuudella tiedoston sisältöä, eivätkä nettisivustojen ylläpitäjät kykene aina tarkistamaan avainsanojen oikeellisuutta aineiston suuren määrän vuoksi.

Toisaalta tiedon hakija saa hakupalveluista tulokseksi runsaasti hänelle hyödyttömiä linkkejä, koska hakusanaa tai -sanoja ei ole mietitty riittävän tarkasti.

Puheentunnistuskin apuna

Sapir-menetelmä hyödyntää kattavasti eri tietosisältöjen analysointi- ja järjestelymenetelmiä. Sen osina käytetään uusimpia puheentunnistustekniikoita, yksittäiskuvien ja videokuvan prosessointimenetelmiä, indeksointialgoritmeja sekä sisällön merkityksellisyyden määrittelymekanismeja.

Järjestelmän käyttäjä voi hakea tietoa esimerkiksi lausumalla haluamansa sanan ääneen tai syöttämällä järjestelmään saksofonia esittävän kuvan, jolloin hakumoottori etsii hänelle verkosta vastaavansisältöiset tai samanmuotoista hahmoa esittävät tiedostot.
Sapir-hanke on käynnistetty Euroopan Unionin kuudennen puiteohjelman raameissa. Siihen osallistuvat IBM:n tutkijoiden ohella Max-Planck-instituutti Saksasta, Padovan yliopisto, Italian kansallinen tutkimusneuvosto CNR sekä Eurix Group Italiasta, Xerox Ranskasta, Masarykin yliopisto Tsekin tasavallasta, Telefonica Espanjasta sekä Telenor Norjasta.
(Prosessori)

Tagit: -
Lähetä Tulosta Tilaa RSS-syöte
Takaisin ylös

Lukijoiden kommentit 0 kommenttia

Kirjaudu sisään kommentoidaksesi.
Takaisin ylös
Takaisin ylös
RSS

Uutiset

TTL ry
Pieni kirjapuoti
Takaisin ylös