Hakukoneissa on isoja puutteita

Uusia hakutekniikoita etsitään
Hakukoneissa on isoja puutteita

Nykyisten webin hakukoneiden tekniikat kolkuttelevat rajojaan – uusi aika tarvitsee uudet työkalut. Webissä on yhä enemmän ja yhä monimuotoisempaa sisältöä, josta ei perinteisellä sanahaulla enää saa irti parhaita hakutuloksia. Uusia menetelmiä, joista osa kuulostaa vielä varsin scifiltä, on kehitteillä.

Uusia hakumenetelmiä esitteli Helsingin yliopiston tietojenkäsittelytieteen laitoksen professori Petri Myllymäki tietoasiantuntijoiden seminaarissa.

Hän puhui muun muassa uudenlaisista tilastollisista malleista, joissa mallinnetaan tilastollisesti sanojen esiintymistä dokumenteissa. Ideana on tunnistaa dokumentin sisältö sanojen perusteella, esimerkiksi siten, että tiettyjä sanoja sisältävä teksti käsittelee USA:n Lähi-idän politiikkaa.

"Nykyisten hakukoneiden kannalta dokumentit ovat vain sanasäkkejä, joista katsotaan, kuinka usein tietyt sanat esiintyvät. Kun saadaan aikaan metatason käsitteitä siitä, miten sanat liittyvät toisiinsa, voidaan hakuna käyttää vaikka omaa dokumenttia. Hakukone analysoi tekstin ja etsii sitten tekstejä, jotka sen mielestä käsittelevät samaa asiaa. Suomi on tämän tutkimuksen kärjessä", Myllymäki mainitsee.

Hänen mukaansa samanlaisia analyysimenetelmiä yritetään soveltaa videoihin, kuvaan ja ääneen: "Vähän scifiltähän tämä kuulostaa, mutta asian tiimoilta on meneillään EU:n rahoittama hanke."

Silmäpeliä ja merkityksiä

Toinen melko lailla tieteistarinoihin sopivalta vaikuttava hakumenetelmä on silmän liikkeisiin perustuva haku. Skanneri seuraa, mitä ihminen katsoi ensimmäisestä hakutukoksesta, ja hakukone tekee uuden haun tämän perusteella.

Semanttisesta webistä on puhuttu pitkään, ja Suomessa ollaan sen kehittämisen etulinjassa. "Siinä pyritään pakottamaan järjestelmällisyyttä järjestäytymättömään maailmaan", Petri Myllymäki kuvailee. Menetelmää on meillä käytetty muun muassa museoesineiden luokitteluun – tavaroille ja asioille pyritään antamaan yhteismitalliset kuvaukset, joiden perusteella niitä voi löytää ja yhdistellä.

Semanttisten menetelmien tuominen webbihakuihin tarkoittaisi sitä, että sivujen sisältö kuvattaisiin tietyssä hakukoneen ymmärtämässä formaatissa. Myllymäki mainitsee yhdeksi suureksi kynnykseksi urakan valtavuuden.

"Kuka tuon kuvailun tekisi, jokainen itse omista sivuistaan? Tuskin toimisi. Esimerkiksi lehmä on pohjalaiselle karjankasvattajalle aivan eri asia kuin intialaiselle munkille", Myllymäki sanoo.

Hän uskoo, että esimerkiksi paikkasidonnaisuus ja yhteisöllisyys nousevat esiin tulevaisuuden hakukoneissa.

Tagit: Hakukone
Lähetä Tulosta Tilaa RSS-syöte
Takaisin ylös

Lukijoiden kommentit 0 kommenttia

Kirjaudu sisään kommentoidaksesi.
Takaisin ylös
Takaisin ylös
RSS

Uutiset

TTL ry
Pieni kirjapuoti
Takaisin ylös