Nálgast 10.000 spurningar

„Bestu notendurnir spila daglega“

„Nú eru nokkrar vikur síðan spurningaleikurinn fór í loftið og við gætum ekki verið ánægðari með móttökurnar. Við nálgumst 10.000 spurningar sem er eftirtektarverður árangur, meira að segja út fyrir landsteinana. Það er búið að koma okkur ótrúlega mikið á óvart hversu vel notendur hafa tekið í leikinn. Enginn innan teymisins hafði búið til spurningaleik áður, en það tókst greinilega vel til því að bestu notendurnir hafa verið að spila daglega undanfarin mánuð og sumir jafnvel spilað í yfir 20 klukkustundir allt í allt.“

Spurningar er glænýr símaleikur þar sem þátttakendur setja fram, fara yfir og svara fjölbreyttum spurningum. Leikurinn var gefinn út fyrir nokkrum vikum síðan. Tilgangur leiksins er að sjálfsögðu að skemmta þátttakendum en markmið með gerð hans var að safna gögnum til að styðja við þróun máltæknilausna fyrir íslensku, m.a. smíði íslensks snjallmennis sem getur svarað spurningum á íslensku. 

Markmiðið er að safna 100.000 spurningum og svörum í opið gagnasafn sem getur nýst öllum sem vinna að íslenskum máltæknilausnum. Njáll Skarphéðinsson er upphafsmaður gagnasöfnunarinnar og forsprakki teymisins sem hefur þróað leikinn. Njáll hefur nú lokið Í námi BSc-námi í tölvunarfræði frá HR og er þessa dagana á fyrstu dögum meistaranáms gervigreind við Carnegie Mellon, einn fremsta háskóla heims á því sviði.

Njáll Skarphéðinsson

„Stóru gagnasöfnin úti í heimi, sem við nálgumst óðfluga í stærð, búa mörg við þann galla að spurningarnar eru óeðlilegar eða að svörin eru bara sótt frá einum, einhæfum miðli. Þetta var allt haft í huga við þróun Spurningar.is og leikurinn er hannaður til þess að leysa þessi vandamál,“ útskýrir Njáll.

Verkefnið er á vegum mál- og raddtæknistofu Háskólans í Reykjavík og meðal annars unnið af nemendum í sumarvinnu á vegum stjórnvalda. Teymið hefur sett sér það háleita markmið að búa til gagnasafn á heimsmælikvarða og er fyrirmyndin eitt stærsta slíka gagnasafn heims, Stanford-gagnasafnið sem inniheldur 100.000 spurningar og svör á ensku.

„Við erum ótrúlega spennt fyrir því hvert framhaldið verður og hvað framtíðin beri í skauti sér. Í dag erum við að mæla árangurinn í fjölda notenda eða fjölda spurninga í gagnagrunninum en það verður gaman að mæla árangurinn í framtíðinni eftir því hvað þessi söfnun leiðir gott af sér fyrir tungumálið okkar. Öll gögnin verða gerð opinber svo að hvaða einstaklingur sem er, sem stundar rannsóknir, getur þróað sín líkön og stutt við íslenska tungu með þessi gögn að leiðarljósi,“ segir hann.

Mál- og raddtæknistofa vinnur að fjölmörgum verkefnum innan hinnar íslensku máltækniáætlunar og hefur frá árinu 2019, í samvinnu við Almannaróm, meðal annars staðið að vel heppnaðri söfnun raddsýna á samromur.is.

Hægt er að nálgast leikinn og frekari upplýsingar á spurningar.is og á App Store og Google Play.