Sjálfvirk greining merkingarvensla í Íslenskri orðabók

  • Anna Björk Nikulásdóttir Ruprecht Karls-Universität Heidelberg
merkingarfræði orða, merkingarvensl, orðabókaskýringar, orðflokkamynstur

Útdráttur

Við hönnun og gerð rafrænna orðabóka er mögulegt að skipuleggja upplýsingarnar með tilliti til merkingar flettiorðanna. Í greininni er kynnt aðferð til þess að draga fram merkingarvensl á grundvelli orðabókarskýringa á sjálfvirkan hátt. Skýringar við allar nafnorðsflettur í Íslenskri orðabók voru greindar. Fyrst voru skýringarnar markaðar með TnT-markara Brants sem hefur verið þjálfaður á íslenskri málheild. Þegar búið var að marka efniviðinn voru orðflokkamynstur í skýringunum greind og á grundvelli þeirra voru settar fram reglur um merkingarleg vensl. Regluforskriftin var skrifuð í forritunarmálinu Smalltalk og leiddi af sér tólið MERKOR. Niðurstöður greiningarinnar lofa góðu. Prófin voru gerð á tilviljunarúrtaki flettiorða, u.þ.b. 1,34% gagnanna. Í hverju orði gat niðurstaðan verið alveg rétt, þ.e.a.s. að öll merkingarvensl sem greind voru handvirkt fundust í greiningu með MERKOR, eða hún gat verið rétt að hluta, þ.e.s.a. ef MERKOR fann ekki öll vensl sem greind höfðu verið handvirkt en greindi þó orð eða merkingarvensl eigi að síður aldrei rangt. Nákvæmnin reyndist vera frá  82,13% (alveg rétt greining) upp í 94,77% (algjörlega rétt greining eða rétt að hluta).  

Heimildir

Agirre, Eneko o. fl. 2000. Extraction of semantic relations from a Basque monolingual dict- ionary using Constraint Grammar. http://arxiv.org/abs/cs.CL/0010025. sótt: 21.01.2005

Alshawi, Hiyan. 1987. Processing Dictionary Definitions with Phrasal Pattern Hierarchies. Computational Linguistics Vol. 13, Nr. 3–4: 195–202.

Beygingarlýsing íslensks nútímamáls. Á vefsíðu Orðabókar Háskólans: http://www.lexis.hi.is/beygingarlysing/

BÍN = Beygingarlýsing íslensks nútímamáls.

Cruse, Alan. 1986. Lexical Semantics. Cambridge: Cambridge University Press.

Geyken, Alexander og Rainer Ludwig. 2003. Halbautomatische Extraktion einer Hyperonymiehierarchie aus dem Wörterbuch der deutschen Gegenwartssprache. www.dwds.de/help/pages/ExtrHyp.pdf. sótt: 28.05.2005

Herbst, Thomas og Michael Klotz. 2003. Lexikografie. Paderborn: Ferdinand Schöningh.

ÍO = Íslensk orðabók.

Íslensk orðabók. 2002 (3. útgáfa). Ritstjóri: Mörður Árnason. Reykjavík: Edda.

Jón Hilmar Jónsson. 2005. Aðgangur og efnisskipan í íslensk-erlendum orðabókum — vandi og valkostir. Orð og tunga 7: 21–40.

Kristín Bjarnadóttir. 1998. Um skýringarorðaforðann. Orð og tunga 4: 33–43.

Mörður Árnason. 1998. Endurútgáfa „Íslenskrar orðabókar“. Stefna — staða — horfur. Orð og tunga 4: 1–8.

Storrer, Angelika. 2001. Digitale Wörterbücher als Hypertexte: Zur Nutzung des Hypertextkonzepts in der Lexikographie. Í: Ingrid Lemberg, Berhard Schröder og Angelika Storrer (ritstj.). Chancen und Perspektiven computergestützter Lexikographie, bls. 53–69. Tübingen: Max Niemeyer.

Svensén, Bo. 1993. Practical Lexicography. Principles and Methods of Dictionary-Making. Oxford/New York: Oxford University Press.

Vefbækur Eddu: Íslensk orðabók; Ensk orðabók: edda.is/vefbaekur. sótt: 31.08.2006

Þórdís Úlfarsdóttir. 2006. Málfræðileg mörkun orðasambanda. Orð og tunga 8: 117–144.

Útgáfudagur
2020-07-25
Tegund
Smágreinar