Risamálheildin, sem er eitt af flaggskipum Árnastofnunar, hefur um árabil verið ein af helstu stoðum íslenskrar máltækni. Risamálheildin inniheldur yfir 2,5 milljarða lesmálsorða úr fjölbreyttum textaflokkum og nýtist bæði til rannsókna og til þróunar máltæknilausna á íslensku.
En til þess að Risamálheildin geti haldið áfram að þróast og endurspegla lifandi, nútímalegt mál þarf stöðugt að uppfæra hana með fleiri og fjölbreyttari textum. Það er ekki síst mikilvægt að hún endurspegli þá orðanotkun sem tíðkast í atvinnulífinu þar sem sérhæfður orðaforði þróast hratt.
Verkefnið „Þín íslenska er málið“, sem Almannarómur og Árnastofnun standa sameiginlega að, styrkir þessa uppbyggingu með því að virkja almenning, fyrirtæki og stofnanir til að deila eigin heimildum, það er stafrænum textum úr eigin starfsemi. Verkefninu var hrundið af stað í Viku íslenskrar tungu með miklum og góðum viðbrögðum frá bæði almenningi og íslensku atvinnulífi.
„Risamálheildin er lykilatriði í rannsóknum á íslensku máli. Ekkert annað málfræðilega greint textasafn á íslensku nálgast hana í stærð eða aðgengi og geta sérfræðingar sem og leikmenn nálgast nákvæmar upplýsingar um málnotkun samtímans í gegnum hana. Þróun máltækni- og gervigreindartóla fyrir íslensku stendur og fellur sömuleiðis með tilvist og gæðum gagnanna sem við höfum. Í þessu samhengi er gríðarlega mikilvægt að við höldum áfram að efla innihald Risamálheildarinnar svo hún endurspegli sem flest svið samfélagsins, enda á íslenska heima á þeim öllum“ segir Hinrik Hafsteinsson, umsjónarmaður Risamálheildarinnar á Árnastofnun.


