Um Beygingarlýsinguna

Markmiðið

Upprunalegt markmið við gerð Beygingarlýsingar íslensks nútímamáls (BÍN) var að koma upp beygingarlýsingu á tölvutæku formi sem nýtast mætti til máltækniverkefna af ýmsu tagi, í orðabókargerð og við málfræðirannsóknir. Jafnframt var markmiðið að gera Beygingarlýsinguna aðgengilega fyrir almenning á vefnum.

Þessi markmið stangast að nokkru leyti á. Í máltækni er lykilatriði að gögnin innihaldi öll málbrigði til þess að koma að fullum notum. Gögnin þurfa að duga til að greina hvað sem er, líka það sem ekki er talið gullaldarmál. Notendur BÍN á vefnum ætlast hins vegar oftar en ekki til þess að fá leiðbeiningar um rétt mál og rangt. Hér er á ferðinni munurinn á lýsandi og vísandi málfræði (forskriftarmálfræði) en eins og nafnið bendir til þá er BÍN í megindráttum lýsandi. Til þess að koma til móts við notendur vefsíðunnar sem vilja vanda mál sitt eru athugasemdir með leiðbeiningum og skýringum fyrir ofan beygingardæmin en í beygingarrammanum sjálfum birtast allar beygingarmyndirnar athugasemdalausar, þótt þeim sé oft og tíðum raðað eftir gildi. Nánar um BÍN í máltækni og beygingardæmin.

Beygingarreglur eða beygingardæmi?

Gögn um beygingu tungumáls er hægt að setja fram sem virkar beygingarreglur eða sem safn beygingardæma. Í BÍN er síðari kosturinn tekinn; BÍN er safn beygingardæma þar sem allar beygingarmyndir eru vistaðar. Markmiðið er að sýna allar og aðeins þær myndir sem raunverulega eru til í nútímamáli.  Reglukerfi sem byggt er á fyrirliggjandi gögnum í upphafi verks hefði orðið bæði van- og ofvirkt, þ.e. það hefði bæði sleppt beygingarmyndum og búið til myndir sem enginn fótur er fyrir. Ástæðan er sú að íslenska beygingakerfið er gríðarlega flókið og afbrigði beygingarmynda eru mjög algengar. Þrátt fyrir aldalanga sögu rannsókna á íslenska beygingakerfinu eru gögn ekki tiltæk til að setja fram reglur sem duga til þess að lýsa því í allri sinni fjölbreytni. Vegna þessa var ákveðið að búa til gagnasafn með heilum beygingardæmum þar sem allar myndir eru vistaðar. Nánar um beygingardæmin, beygingakerfið og rannsóknir að baki BÍN.

Saga BÍN

Vinna við BÍN hófst árið 2002 hjá Orðabók Háskólans og var fyrsti áfangi verksins unninn fyrir styrk úr tungutækniátaki Menntamálaráðuneytisins. Fyrsta útgáfan var tilbúin 2004 og var ætluð til máltækninota, 173.389 beygingardæmi á formi xml-skráa sem afhent voru á geisladiskum. Orðabók Háskólans sá um miðlun efnisins, samkvæmt samningi við Menntamálaráðuneytið.

Beygingardæmin birtust fyrst á vefsíðu Orðabókar Háskólans 2004. Árið 2005 fékkst styrkur úr Tækniþróunarsjóði til þess að gera gagnagrunn fyrir BÍN og þá hófst samvinna við fyrirtækið Spurl um verkið. Ný vefsíða var síðan opnuð 2007 en þá var Orðabók Háskólans orðinn hluti af Stofnun Árna Magnússonar í íslenskum fræðum og Spurl orðinn hluti af Já ehf. Frá 11. nóvember 2009 er aðgangur að gögnum úr BÍN til máltækninota opinn á vefsíðu BÍN, fyrir atbeina Já sem styrkir verkefnið. Nánar um sögu BÍN og nýja útgáfu 2013.

Fólkið á bak við BÍN

Samstarfið við Spurl og Já

 

 

KB 1.10.2013