Alþingi fékk talgreini að gjöf

Alþingi fékk að gjöf talgreini á viðburði Almannaróms um máltækni á Degi íslenskrar tungu þann 16. nóvember síðastliðinn.

Talgreinir Alþingis hefur þegar skráð niður um 640 klukkustundir af ræðum þingmanna. Hann var þróaður af vísindamönnum við verkfræðideild Háskólans í Reykjavík samkvæmt samningi við Alþingi. Jón Guðnason, dósent við verkfræðideild HR, afhenti Rögnu Árnadóttur, skrifstofustjóra Alþingis, talgreininn í formi gamallar ritvélar.

Auðveldar birtingu ræða

„Talgreinirinn er mikil bylting og gagnast ekki bara Alþingi við greiningu á þingræðum heldur getur hann nýst á fjölmörgum öðrum sviðum,“ sagði Ragna þegar hún tók á móti talgreininum. Talgreinirinn nýtir gervigreind til að skrá um tíu mínútur af ræðum á einungis þremur og hálfri mínútu, hann hefur allt að 90% rétt eftir og auðveldar til muna skráningu og birtingu á ræðum alþingismanna.

Jón Guðnason sagði við sama tilefni: „Þessi afhending markar lokin á mjög farsælli og ánægjulegri þróunarvinnu og góð ástæða til að fagna tímamótunum þó verkefnið verði áfram í þróun.“

Gerðu mállíkan fyrir Alþingi

Fyrsti fasi þróunarstarfsins var að smíða og þjálfa nýjan talgreini og prófa mismunandi tæknilegar útfærslur af talgreiningu sem hentaði verkefninu. Þá þurfti að gera hið mikla magn upptaka, sem Alþingi á af ræðum, aðgengilegar fyrir talgreininn til þjálfunar. Einnig þurfti að smíða sérhæft mállíkan sem hentaði málfari í ræðum á Alþingi og gera kleift að bæta við orðum sem ekki er að finna í útgefnum orðabókum og orðasöfnum. Dæmi um slíkt orð er „rafsígarettur“.

Aukin sjálfvirkni

Annar þáttur vinnunnar, sem hófst í október á síðasta ári, var samþætting talgreinisins við tölvukerfi Alþingis og uppsetning ferla til að nýta talgreininn í að skrifa upp ræður þingmanna, fara yfir og leiðrétta þá skráningu og koma ræðunum á vef Alþingis.

Opinn hugbúnaður

Talgreinir Alþingis er smíðaður í opnum hugbúnaði eins og aðrar afurðir máltækniáætlunar og ætti að geta nýst mörgum öðrum sem þurfa að breyta töluðu máli í skrifaðan texta.