Skrambi

Skrambi er nýtt villuleitarforrit sem leiðréttir bæði ósamhengisháðar og samhengisháðar villur. Hann er byggður á gögnum úr Beygingarlýsingu íslensks nútímamáls en forritið tók fyrst á sig mynd í meistaraverkefni Jóns Friðriks Daðasonar 2012, Post-Correction of Icelandic OCR Text.

Athugið að Skrambi er enn í vinnslu og leiðrétting á samhengisháðum villum er ekki virk sem stendur. Skrambi leiðréttir ekki heldur málfræðivillur enn sem komið er.

Vefútgáfan af Skramba er öllum opin. Í glugga á vefsíðunni er hægt að setja texta sem er allt að 3.000 orð og leiðrétta allt að 100 villur.

Skrambi er afrakstur verkefna sem unnin hafa verið á Stofnun Árna Magnússonar í íslenskum fræðum frá árinu 2010:

  1. Gerð hugbúnaðar til vélrænnar leiðréttingar á ljóslesnum texta (2010). Verkefnið var styrkt af Vinnumálastofnun.
  2. Hönnun hugbúnaðar fyrir samhengisháða stafsetningarleiðréttingu (2011). Verkefnið var styrkt af Nýsköpunarsjóði námsmanna og Vinnumálastofnun.
  3. Fjölnir fyrir hvern mann (2012). Verkefnið var styrkt af Nýsköpunarsjóði stúdenta.    

Skrambi er til ýmissa hluta gagnlegur og leiðréttir ljóslesinn texta, færir eldri texta til nútímamáls og leiðréttir stafsetningu, bæði í nútímamálstexta og í eldri textum. Allar útgáfur Skramba byggjast á sömu aðferð en gagnasöfnin sem stuðst er við í hverju verkefni eru breytileg eftir því frá hvaða tíma textarnir eru sem unnið er með.

Skrambi hlaut hagnýtingarverðlaun Háskóla Íslands 2012 og styrk úr samfélagssjóði Landsbanka Íslands 2011.

 

KB 17.12.2014