Microsoft styrkir íslenskt máltækniverkefni

Mynd: Lilja Alfreðsdóttir, fyrrverandi menningarráðherra, ásamt sendinefnd á fundi Scott Guthrie, aðstoðarframkvæmdastjóra Microsoft Cloud og AI Group, vorið 2024.

Microsoft styrkir íslenskt máltækniverkefni

Íslenskt máltækniverkefni á vegum Háskóla Íslands í samvinnu við Almannaróm er eitt ellefu evrópskra verkefna sem hlutu svokallaðan Microsoft AI for Good LINGUA-styrkinn, sem veittur var þann 20. janúar síðastliðinn. Verkefnið hlaut um 6 milljón króna styrk og þótti sérstaklega áhugavert samkvæmt dómnefnd, sem tók fram að verkefnið væri ekki bara tæknilega sterkt heldur hefði það mikla burði til að styðja við aukið jafnrétti í máltækni minni tungumála.

Verkefnið ber heitið „Icelandic AI Safety Benchmarks“ og snýst um þróun og staðfæringu á þekktum öryggisvörnum fyrir mállíkön fyrir íslenskt mál og menningu. Slík öryggispróf hafa skort fyrir íslensku og í einhverjum tilfellum hamlað því að íslenska sé innleidd inn í tæknilausnir erlendra fyrirtækja, þar sem þeim hefur reynst erfitt að fylgjast með því hvort íslenskt úttak lausna þeirra sé öruggt og í samræmi við öryggisreglur fyrirtækjanna.

„Þessi próf virka sem staðlað gæðaeftirlit fyrir gervigreind á íslensku. Þau mæla hvort mállíkön bregðist rétt við skaðlegum leiðbeiningum eða svari með eitruðum hætti,“ segir Hafsteinn Einarsson, dósent í tölvunarfræði við Háskóla Íslands, sem fer fyrir verkefninu. Að sögn Hafsteins sýna rannsóknir að öryggisvarnir stóru líkananna virki oft verr á öðrum málum en ensku. „Með því að þróa próf sem taka mið af íslensku máli og menningu gerum við þróunaraðilum kleift að meta öryggi kerfanna áður en þau eru tekin í notkun.“

Undir verkefninu verða þrjú þekkt öryggispróf staðfærð fyrir íslensku og íslenskar aðstæður; RTP-LX, Aya Red-Teaming og XSafety, sem öll verða gefin út undir opnum leyfum. Þau verða síðan keyrð á öllum helstu mállíkönum og niðurstöður prófanna birtar á þar til gerðu mælaborði.

Mynd:Samsett/Kristinn Ingvarsson

Mynd:Samsett/Kristinn Ingvarsson

Verkefni á borð við þetta koma til með að nýtast hagnýtt í málþekkingu, þjónustu, atvinnulífi og menningu, og stuðlar að betri tækni sem þjónar öllum tungumálum, ekki aðeins þeim stærstu.

Microsoft’s AI for Good Lab tilkynnti í haust, í tilefni af degi evrópskra tungumála, að fyrirtækið hyggðist styrkja verkefni sem væru til þess fallin að styðja við stafræna framtíð evrópskra tungumála. Sérstök áhersla var lögð á verkefni sem myndu auka magn gæðagagna hjá litlum málsvæðum, til að auka vægi þeirra tungumála í gervigreind og tækni.

Ellefu verkefni frá tíu löndum hlutu styrki með beinu fjármagni og enn fleiri fá ókeypis þjónustu hjá Microsoft í formi ókeypis notkunar á Azure gagnamagni.