Um orðaforðann í BÍN

Orðaforðinn í BÍN er aðallega úr almennu nútímamáli, auk mannanafna (þ.e. skírnarnafna) og örnefna. BÍN er ekki tæmandi heimild um íslenskan orðaforða en verkið er í stöðugri vinnslu og smám saman bætast orð við, bæði orðaforði úr almennu máli og sérorðaforði. Sjá nánar um heimildir orðaforðans í BÍN og skiptingu hans í sérsvið.

Viðurkennd íslensk orð og rétt mál og rangt

BÍN er ekki mælikvarði á það hvort orð eru „góð og gild“ íslensk orð. Þar kemur tvennt til:

  • BÍN er ekki tæmandi lýsing á íslenskum orðaforða og orðum sem ekki finnast í BÍN hefur ekki verið úthýst úr verkinu; þau hafa einfaldlega ekki fundist í þeim heimildum um orðaforðann sem notaðar eru í BÍN. Nánar um orðafjölda i íslensku.
  • Þá eru misjafnlega þörf tökuorð einnig í BÍN, t.d. nafnorðið ballans þó að betra sé að nota orðið jafnvægi þess í stað. Tökuorðið er m.ö.o. ekki endilega sérstaklega gott orð en það er sannanlega notað í íslensku máli. 

Allur orðaforðinn í BÍN er úr íslenskum heimildum en BÍN er í aðalatriðum lýsandi en ekki vísandi heimild um orðaforðann. Leiðbeinandi eða vísandi heimildir um íslenska stafsetningu eru t.d. Stafsetningarorðabókin (Íslensk málnefnd 2006), Handbók um íslensku (Stofnun Árna Magnússonar í íslenskum fræðum 2011) og Málfarsbanki Stofnunar Árna Magnússonar í íslenskum fræðum, auk Íslenskrar orðabókar (Forlagið 5. útg. 2010). Beygingarlýsingin á hins vegar að vera lýsandi heimild um beygingarkerfið eins og það birtist í ræðu og riti.

Nútímamál, forna málið og skáldamál

Orðaforðinn í BÍN er að mestu leyti úr almennu nútímamáli en stöku orð og beygingarmyndir úr eldra máli og skáldamáli er einnig að finna í verkinu, einkum ef ætla má að orðin komi fyrir í máli núlifandi Íslendinga, í ræðu og í riti. Þetta á aðallega við um efni sem algengt er í nútímatextum, t.d. í algengum tilvitnunum í bókmenntir og í orðasamböndum þar sem eldri málstig lifa áfram í einstökum beygingarmyndum. Oft er látið nægja að geta slíkra orðmynda í athugasemd ofan við beygingardæmið án þess að þær séu birtar í beygingardæminu sjálfu. Sá háttur er t.d. hafður á til að sýna gamla beygingarmynd af orðinu skjöldur í orðasambandinu ganga fram fyrir skjöldu. Fyrir utan stöku undantekningar af þessu tagi þá er BÍN hvorki ætlað að sýna forna málið né skáldamál. Þar leynist þó dálítill slæðingur af eldri orðaforða sem ratað hefur inn úr öðrum heimildum, sjá hér.

Með nútímamáli er átt við málið á síðari hluta 20. aldar og í byrjun þeirrar 21.

Ritháttur orða

Ástæða er til að taka fram að ritháttur orða er með ýmsu móti í BÍN enda er sú raunin í þeim heimildum sem orðaforðinn er fenginn úr, þó að miðað sé við nútímamál. Athugasemdir um réttritun fylgja orðum til hægðarauka fyrir notendur eftir því sem tök eru á. Þetta á t.d. við um ritmyndirnar allskyns, scandíum og breti þar sem vísað er á ritmyndirnar alls kyns, skandíum (og skandín) og Breti. Viðfangsefnið í BÍN er m.ö.o. beygingarkerfið og verkinu er ekki ætlað hlutverk stafsetningarorðabókar.

Samsett orð og ósamsett

Orðaforðinn í BÍN er ekki valinn með tilliti til flettugildis eins og gert er þegar orð eru valin í orðabækur, þ.e. vegna sérkenna sem kalla á einhvers konar útlistun, t.d. vegna merkingar, setningarstöðu, málvenju, stílgildis o.s.frv. Vegna þessa er þungamiðjan í orðabókum oftast nær ósamsett orð og lesgerð (lexíkalíseruð) samsett orð. Svokallaðar virkar (þ.e. merkingarlega gagnsæjar) samsetningar eru t.d. yfirleitt ekki taldar eiga erindi í orðabækur.

Vegna þess að BÍN er ætluð til máltækninota er mjög mikilvægt að orðaforðinn sé eins mikill og nokkur kostur er. Ástæðan er einkum sú að í máltækni eru óþekkt orð yfirleitt mun erfiðari viðfangs þannig að mikilvægt er að hægt sé að þekkja allar beygingarmyndir orðs og tengja þær við uppflettimynd (nefnimynd, lemmu) sína. Þar sem íslensk orðmyndun er mjög virk verður BÍN aldrei tæmandi lýsing á orðaforðanum. Eftir því sem orðaforðinn í BÍN verður meiri verður efniviðurinn einnig betri stofn í greiningartól sem greinir óþekkt samsett orð. 

Annað efni sem er ekki í BÍN

Þar sem BÍN er safn beygingardæma eru óbeygjanleg orð ekki höfð með, og ekki heldur annað efni sem ekki beinlínis telst orð, s.s. skammstafanir og tákn. Til máltækninota má nálgast slíkt efni hér.

 

KB 12.2.2015