Verndum íslenska tungu í stafrænni tækni

Til að fylgja íslensku inn í framtíðina er núna unnið samkvæmt metnaðarfullri Máltækniáætlun, þeirri fyrstu sem gerð er fyrir íslensku. Almannarómur sér um framkvæmd áætlunarinnar.

 

Máltækniáætlun

Markmið máltækniáætlunar er að vernda íslenska tungu með því að tryggja að við getum og munum nota íslensku í samskiptum við og í gegnum stafræn tæki og tölvur.

Máltækniáætlunin er verkáætlun með skýrum markmiðum. Hún var gefin út árið 2017.

Lesa áætlunina: Máltækni fyrir íslensku 2018-2022

Hvað er máltækni?

Máltækni vísar til samvinnu tungumáls og tölvutækni. Tæknin beinist að því að þróa kerfi sem geta unnið með og skilið mannleg mál, og stuðla að notkun þeirra í samskiptum manns, tölvu og annarra tækja sem byggja á stafrænni tækni.

Máltækni mun, ef allt fer að óskum, gera okkur kleift að biðja símann að lesa Laxness fyrir svefninn, Alexu um að spila Spilverk þjóðanna og Facebook að fallbeygja nöfnin sem við merkjum í færslum.

Almannarómur

Almannarómur er miðstöð máltækni og ber ábyrgð á framkvæmd máltækniáætlunar.

Rannsóknar- og þróunarhópurinn SÍM (Samstarf um íslenska máltækni) vinnur nú að smíði og þróun innviða fyrir íslenska máltækni.

  • 0,1
    milljarðar í fyrsta stig þróunar máltæknilausna fyrir íslenska tungu
  • 0
    sérfræðingar vinna að rannsóknum og þróun á máltækni á Íslandi
  • 1990
    hófst vinna við kjarnaverkefni í máltækni

Lausnir

Hverjar eru kjarnalausnirnar í þróun máltækni fyrir íslensku?
  1. Markmiðið með þróun talgreinis er að til verði forrit sem geti túlkað eðlilegt tal á íslensku. Talgreiningu er hægt að nota á mörgum sviðum, s.s. í tölvukerfum bíla, í heilbrigðiskerfinu, í þjónustuverum fyrirtækja, í tölvustuddu tungumálanámi, til stuðnings fólki sem vegna fötlunar á erfitt með innslátt texta, en talgreinir gefur notendum kost á að eiga samskipti við tölvustýrð tæki með tali í stað lyklaborðs.

  2. Þróun talgervils miðar að því að hann geti lesið upp íslenskan texta með skýrum og auðskiljanlegum framburði, og eðlilegu tónfalli. Talgervlar fyrir íslensku verða þróaðir þannig að hægt verður að framleiða margar mismunandi raddir. Þannig geta þeir sem vilja bæta sjálfvirkum upplestri eða talsvörun við sín kerfi samþætt talgervingu við sinn hugbúnað.

  3. Í vélrænum þýðingum eru tölvur notaðar til að þýða texta úr einu tungumáli yfir á annað. Vélrænar þýðingar geta þannig flýtt fyrir öllu starfi þýðenda og styrkt stöðu smærri tungumála verulega, með því t.d. að bjóða upp á rauntímaþýðingar á sjónvarpsefni, og draga verulega úr kostnaði.

  4. Hugbúnaður til málrýni getur hjálpað verulega við leiðréttingar á stafsetningu og málfari, og getur veitt margvíslegar leiðbeiningar við textaskrif. Auk þess að nýtast öllum almenningi við almenn skrif getur sérhæfð málrýni nýst fjölbreyttum hópi notenda: starfsfólki fyrirtækja og stofnana, börnum, fólki með íslensku sem annað mál, lesblindum, o.s.frv. Málrýni er líka mjög mikilvæg fyrir þróun annars konar máltæknihugbúnaðar, t.d. leitarvéla og vélþýðinga, og til að gera ljóslesna texta nothæfa í stafrænu umhverfi.

  5. Undir málföng falla málleg gagnasöfn og stoðtól. Málleg gagnasöfn skiptast í texta- og orðasöfn ásamt talgögnum. Þau nýtast til að mynda við þjálfun á mál- og hljóðlíkönum fyrir mismunandi máltæknihugbúnað. Stoðtól eru nauðsynleg til þess að útbúa gögn til notkunar í máltækni, en þau framkvæma einnig grunngreiningu á texta, sem oft er fyrsta skref í flóknari máltæknihugbúnaði. Nægilegt magn viðeigandi gagna og áreiðanleg stoðtól eru grunnur og forsenda allrar þróunar í máltækni.

Ert þú búin/n að gefa raddsýni í gegnum Samróm?

Til að fá tölvur til að skilja íslenska tungu svo hægt sé að eiga samskipti þarf mikið magn gagna á formi lesinna setninga. Almannarómur, Deloitte og HR þróuðu því vefinn Samróm, en þar geta þau sem tala íslensku lagt íslenskunni lið með einföldum hætti.

Samstarf við atvinnulífið

Framkvæmdaáætlun Almannaróms leggur áherslu á að rannsóknar- og þróunaraðilar leiti frekara samstarf við atvinnulíf, í því skyni að fyrirtækni geti hraðað uppbyggingu þekkingar innan sinna veggja og þar með þróun máltæknilausna fyrir viðskiptavini.

Þannig stuðlum við að því að rannsakendur geti fengið innsýn í þarfir notenda og að almenningur komist nær því að geta átt viðskipti og samskipti á móðurmálinu.