Málfræðileg mörkun orðasambanda

  • Þórdís Úlfarsdóttir Orðabók Háskólans
orðtök, orðasambönd, málfræðigreining, mörkun, markari

Útdráttur

The topic of this article is the electronic tagging of phrases, fixed expressions and idioms as found in the collection of Orðabók Háskólans (Institute of Lexicography). The tool used for this, called <i>TnT-tagger</i>, grammatically analyses the words contained within the phrases. For this experiment, ca. 200 phrases were used, centred on two verbs (<i>afla</i> and <i>aka</i>) and two adjectives (<i>feitur</i> and <i>glaður</i>). The tagging process is described as well as the outcome of the tagging and the errors which occurred. The results are measured. The experiment also includes the tagging of several definitions from a dictionary (<i>Íslensk orðabók</i>). It is shown how the tags produced can be used for sorting the phrases so that they fall into groups of syntactic patterns. It is argued that this method is useful for finding patterns in the syntax of the keywords in question and for evaluating the frequency of various constructions.

Heimildir

Eiríkur Rögnvaldsson, Auður Þ. Rögnvaldsdóttir, Kristín Bjarnadóttir og Sigrún Helgadóttir. 2002. Vélræn málfræðigreining með námfúsum markara. Orð og tunga 6:1–9.

Íslensk orðabók. 2002 (3. útgáfa). Ritstj. Mörður Árnason. Reykjavík: Edda.

Jón Hilmar Jónsson. 2001. Orðastaður (2. útgáfa). Reykjavík: JPV.

Jörgen Pind (ritstj.), Friðrik Magnússon og Stefán Briem. 1991. Íslensk orðtíðnibók. Reykjavík: Orðabók Háskólans.

Kristín Bjarnadóttir. 2004. Beygingarlýsing íslensks nútímamáls. Í: Samspil tungu og tækni. Afrakstur tungutækniverkefnis menntamálaráðuneytisins. Bls. 23–25.

Sigrún Helgadóttir. 2004a. Markari fyrir íslenska texta. Í: Samspil tungu og tækni. Afrakstur tungutækniverkefnis menntamálaráðuneytisins. Bls. 55–64.

Sigrún Helgadóttir. 2004b. Mörkuð íslensk málheild. Í: Samspil tungu og tækni. Afrakstur tungutækniverkefnis menntamálaráðuneytisins. Bls. 65–71.

Sigrún Helgadóttir. 2005. Testing Data-Driven Learning Algorithms for PoS Tagging of Icelandic. Í: Nordisk Sprogteknologi 2004 – Nordic Language Technology. Bls. 257–265.

Heimildir á vefnum

Orðasambandaskrá Orðabókar Háskólans: www.lexis.hi.is/osamb/ osamb.pl

Upplýsingar um Orðasambandaskrá Orðabókar Háskólans: www.lex- is.hi.is/osamb/info.pl
Útgáfudagur
2020-07-29
Tegund
Smágreinar