Verndum íslenska tungu í stafrænni tækni

Almannarómur er óháð sjálfseignarstofnun sem hefur það hlutverk að tryggja að íslensk tunga sé notuð í allri tækni. Til að fylgja íslensku inn í framtíðina er unnið samkvæmt metnaðarfullri Máltækniáætlun stjórnvalda og sér stofnunin um framkvæmd hennar.  

Almannarómur – Miðstöð máltækni

Almannarómur er stofnaður í kringum þrjú megin markmið:

  • Að tryggja að íslenska standi jafnfætis öðrum tungumálum í tækniheiminum.
  • Að vernda íslenska tungu.
  • Að stuðla að aðgengi almennings og atvinnulífs að nauðsynlegri tækni.

Almannarómur er miðstöð máltækni, samkvæmt samningi við menningar- og viðskiptaráðuneytið. Almannarómur ber ábyrgð á framkvæmd máltækniáætlunar stjórnvalda. Miðstöðin er óháð sjálfseignastofnun.

Við framkvæmd máltækniáætlunar er annars vegar lögð áhersla á hagnýtingarverkefni sem gera íslenskumælandi tækni öllum aðgengilega og hins vegar á áframhaldandi þróun þeirra innviða sem til þess þarf, í samstarfi við vísindafólk, stofnanir og fyrirtæki, innalands sem utan.

  • 0,1
    milljarðar í annað stig þróunar máltæknilausna fyrir íslenska tungu
  • 0
    sérfræðingar vinna að rannsóknum og þróun á máltækni á Íslandi
  • 1990
    hófst vinna við kjarnaverkefni í máltækni

Máltækniáætlun

Markmið máltækniáætlunar er að vernda íslenska tungu með því að tryggja að við getum og munum nota íslensku í samskiptum við og í gegnum stafræn tæki og tölvur.

Máltækniáætlun 2 skilgreinir skýr markmið fyrir íslenska máltækni. Hún var gefin út árið 2024 og verður aðlöguð reglulega í samræmi við tækniframfarir á sviði máltækni.

Lesa áætlunina: Íslenskan okkar, alls staðar - Áætlun um íslenska máltækni

Hvað er máltækni?

Máltækni vísar til samvinnu tungumáls og tölvutækni. Tæknin beinist að því að þróa kerfi sem geta unnið með og skilið mannleg mál, og stuðla að notkun þeirra í samskiptum manns, tölvu og annarra tækja sem byggja á stafrænni tækni.

Máltækni mun, ef allt fer að óskum, gera okkur kleift að biðja símann að lesa Laxness fyrir svefninn, Alexu um að spila Spilverk þjóðanna og Facebook að fallbeygja nöfnin sem við merkjum í færslum.

Dæmi um íslenskar máltæknilausnir sem opnar eru almenningi eru:

  • yfirlestur.is - vefur sem rýnir íslenskan texta.
  • velthyding.is - vefur sem þýðir íslenskan texta yfir á ensku og enskan yfir á íslensku.
  • m.is - vefur á vegum Árnastofnunar sem gerir orðabækur og upplýsingar um íslenska tungu aðgengilegri fyrir yngra fólk og fólk sem er að læra íslensku sem annað mál og býður upp á vélþýðingar úr íslensku á ensku og öfugt.
  • Málstaður - málrýni, talgreining og fleira á vef máltæknifyrirtækisins Miðeindar.
  • Tiro - sjálfvirk talgreining fyrir talað mál yfir í ritaðan texta.
  • Símarómur - smáforrit fyrir Android-síma sem gerir notendum kleift að nota íslenskan talgervil sem skjálesara
  • Málvinnsla Árnastofnunar - Málvinnsluvefur Árnastofnunar sem býður upp á mörkun og lemmun texta, orðskiptitól sem skiptir orðum milli lína og forritaskil til að keyra tólin á kerfisbundinn hátt.

Lausnir

Hverjar eru kjarnalausnirnar í þróun máltækni fyrir íslensku?
  1. Markmiðið með þróun talgreinis er að til verði forrit sem geti túlkað eðlilegt tal á íslensku. Talgreiningu er hægt að nota á mörgum sviðum, s.s. í tölvukerfum bíla, í heilbrigðiskerfinu, í þjónustuverum fyrirtækja, í tölvustuddu tungumálanámi, til stuðnings fólki sem vegna fötlunar á erfitt með innslátt texta, en talgreinir gefur notendum kost á að eiga samskipti við tölvustýrð tæki með tali í stað lyklaborðs.

  2. Þróun talgervils miðar að því að hann geti lesið upp íslenskan texta með skýrum og auðskiljanlegum framburði, og eðlilegu tónfalli. Talgervlar fyrir íslensku verða þróaðir þannig að hægt verður að framleiða margar mismunandi raddir. Þannig geta þeir sem vilja bæta sjálfvirkum upplestri eða talsvörun við sín kerfi samþætt talgervingu við sinn hugbúnað.

  3. Í vélrænum þýðingum eru tölvur notaðar til að þýða texta úr einu tungumáli yfir á annað. Vélrænar þýðingar geta þannig flýtt fyrir öllu starfi þýðenda og styrkt stöðu smærri tungumála verulega, með því t.d. að bjóða upp á rauntímaþýðingar á sjónvarpsefni, og draga verulega úr kostnaði.

  4. Hugbúnaður til málrýni getur hjálpað verulega við leiðréttingar á stafsetningu og málfari, og getur veitt margvíslegar leiðbeiningar við textaskrif. Auk þess að nýtast öllum almenningi við almenn skrif getur sérhæfð málrýni nýst fjölbreyttum hópi notenda: starfsfólki fyrirtækja og stofnana, börnum, fólki með íslensku sem annað mál, lesblindum, o.s.frv. Málrýni er líka mjög mikilvæg fyrir þróun annars konar máltæknihugbúnaðar, t.d. leitarvéla og vélþýðinga, og til að gera ljóslesna texta nothæfa í stafrænu umhverfi.

  5. Undir málföng falla málleg gagnasöfn og stoðtól. Málleg gagnasöfn skiptast í texta- og orðasöfn ásamt talgögnum. Þau nýtast til að mynda við þjálfun á mál- og hljóðlíkönum fyrir mismunandi máltæknihugbúnað. Stoðtól eru nauðsynleg til þess að útbúa gögn til notkunar í máltækni, en þau framkvæma einnig grunngreiningu á texta, sem oft er fyrsta skref í flóknari máltæknihugbúnaði. Nægilegt magn viðeigandi gagna og áreiðanleg stoðtól eru grunnur og forsenda allrar þróunar í máltækni.

Ert þú búin/n að gefa raddsýni í gegnum Samróm?

Til að fá tölvur til að skilja íslenska tungu svo hægt sé að eiga samskipti þarf mikið magn gagna á formi lesinna setninga. Almannarómur, Deloitte og HR þróuðu því vefinn Samróm, en þar geta þau sem tala íslensku lagt íslenskunni lið með einföldum hætti.

Samstarf við atvinnulífið

Máltækniáætlun 2024-2026 leggur áherslu á hagnýtingu máltækniinnviða með því markmiði að tækni sem talar og skilur íslensku komist í allra hendur. Almannarómur styður og ráðleggur öllum fyrirtækjum og frumkvöðlum sem hafa áhuga á að skoða tækifæri til þróunar slíkra lausna.

Haustið 2024 verður auglýst fyrsta úthlutun úr nýjum hagnýtingar- og innleiðingarsjóði menningar- og viðskiptaráðherra sem Almannarómur mun hafa umsjón með.