Hvert á að sækja orðaforðann í orðabók?

  • Kristín Bjarnadóttir Stofnun Árna Magnússonar í íslenskum fræðum / Hásk´óli Íslands
orðabókarfræði, uppflettiorð, orðaforði, málheild, vélræn orðtaka

Útdráttur

The topic of this paper is different methods in assembling a list of headwords for Icelandic dictionaries. Until recently, the classic Icelandic dictionary (Íslensk orðabók) originally published in 1963, has been the primary source of data of the vocabulary for Icelandic lexicographers, with the collections at the department of lexicography of The Árni Magnússon Institute for Icelandic Studies as additional sources. With the advent of electronic text collections, notably the tagged Icelandic corpus (Mörkuð íslensk málheild, MÍM), Icelandic lexicographers now have access to a huge new source of data. The use of data on frequency from these new sources is of great value to lexicographers in the choice of headwords, but the complete coverage of the words and word forms in the texts made possible by new methods of word extraction also complements older material by filling accidental gaps in material assembled by older methods of dictionary excerption. Partly because of data scarcity problems in a language with a very rich morphology, the conclusion in the paper is that word frequency alone cannot be the base of an Icelandic dictionary at this point in time, as the volume of texts needed for a good coverage of the vocabulary far exceeds anything available now. One of the main reasons for this is a very productive system of compounding, making it necessary to split compounds before attempting to use frequency for the selection of vocabulary.

Heimildir

Aðalsteinn Eyþórsson. 1998. Síðasti furðufuglinn ― eða gæsin sem stóð á öndinni. Frejas Psalter til brug for Jonna Louis-Jensen, bls. 5–7. København. (Einnig birt á Kistunni 20. maí 2002: www.kistan.is; sótt 12.3.2013.)

Aðalsteinn Eyþórsson. 2005. Hver er kjarni orðaforðans? Orð og tunga 7:9‒20.

Árni Böðvarsson (ritstj.). 1963. Íslensk orðabók handa skólum og almenningi. Reykjavík: Bókaútgáfa Menningarsjóðs.

Árni Böðvarsson (ritstj.). 1983. Íslensk orðabók. 2. útg. Reykjavík: Bókaútgáfa Menningarsjóðs.

Ásgeir Blöndal Magnússon. 1989. Íslensk orðsifjabók. Reykjavík: Orðabók Háskólans.

Ásta Svavarsdóttir. 2008. Ordbogsbrug og ordbogskultur i Island. Undersøgelse of ordbogsbrug blandt islandske modermålslærere. LexicoNordica 15:115‒134.

Beygingarlýsing íslensks nútímamáls. Ritstjóri Kristín Bjarnadóttir. http://bin.arnastofnun.is.

Björn Halldórsson. 1814. Lexicon Islandico-Latino-Danicum Björnonis Haldorsionii, I‒II. Havniæ.

Blöndalsorðabók = Sigfús Blöndal. 1920‒1924. Íslensk-dönsk orðabók.
Cobuild
= Sinclair, John (ritstj.). 1987. Collins Cobuild English Language Dictionary.

Erla Hallsteinsdóttir. 2007. Íslenskur orðasjóður. Orð og tunga 7:109‒124.

Guðbrandur Vigfússon. 1874‒1876. An Icelandic-English Dictionary based on the MS. Collections of the late Richard Cleasby. Oxford.

Guðrún Kvaran. 1997. Rætur og heimildir. Orð og tunga 3:9‒14.

Ío = Íslensk orðabók (sjá Árni Böðvarsson 1963, 1983; Mörður Árnason 2000.)

Íslenskur orðasjóður. http://wortschatz.uni-leipzig.de/ws_ice/.

Íslenskt textasafn. http://arnastofnun.is/page/arnastofnun_gagnasafn_textasafn.

Jón Friðrik Daðason. 2012. Post-Correction of Icelandic OCR Text. MS ritgerð í tölvunarfræði við Háskóla Íslands. (Sjá: h􏰀p://hdl.handle.net/1946/12085.)

Jón Hilmar Jónsson. 1994. Orðastaður. Reykjavík: Mál og menning.

Jón Hilmar Jónsson. 2013. Að byggja undir íslensk-erlenda orðabók. For-
greining og orðabókarefni. Orð og tunga 15:1‒22.

Jörgen Pind, Friðrik Magnússon og Stefán Briem. 1991. Íslensk orðtíðnibók. Reykjavík: Orðabók Háskólans.

Kristín Bjarnadóttir. 1995. Lexicalization and the Selection of Compounds
for a Bilingual Icelandic Dictionary Base. Í: Ásta Svavarsdóttir, Guðrún Kvaran, Jón Hilmar Jónsson (ritstj.), Nordiske studier i leksikografi 3, bls. 255‒263. Reykjavík: NFL, Nordisk språksekretariat og Orðabók Háskólans.

Kristín Bjarnadóttir. 1998. Norræna verkefnið. Skýrsla um íslenskan orðabókarstofn, 6. mars 1998. http://www.lexis.hi.is/kristinb/norr.pdf.

Kristín Bjarnadóttir. 2012. The Database of Modern Icelandic Inflection. Proceedings of “Language Technology for Normalization of Less-Resourced Languages”, SaLTMiL 8 ‒ AfLaT 2012. Istanbul, Tyrklandi.

Mörður Árnason. 1998. Endurútgáfa Íslenskrar orðabókar: Stefna ‒ staða ‒ horfur. Orð og tunga 4:1‒8.

Mörður Árnason (ritstj.). 2000. Íslensk orðabók, tölvuútgáfa. Reykjavík: Edda hf.

Orðabanki Íslenskrar málstöðvar. Ritstjóri Ágústa Þorbergsdóttir. http://www.ordabanki.hi.is/wordbank/.

Mörkuð íslensk málheild. Ritstjóri Sigrún Helgadóttir. http://mim.hi.is.

Ritmálssafn Orðabókar Háskólans. http://www.arnastofnun.is/page/gagnasofn_ritmalssafn.

Sigfús Blöndal. 1920‒1924. Íslensk-dönsk orðabók. Reykjavík.

Sigrún Helgadó􏰀ir, Ásta Svavarsdó􏰀ir, Eiríkur Rögnvaldsson, Kristín Bjarnadóttir og Hrafn Loftsson. 2012. The Tagged Icelandic Corpus (MÍM). Proceedings of “Language Technology for Normalization of Less-Resourced Languages”, SaLTMiL 8 – AfLaT 2012. Istanbul, Tyrklandi.

Sinclair, John (ritstj.). 1987. Collins Cobuild English Language Dictionary. London and Glasgow: Collins.

Sverrir Hólmarsson, Christopher Sanders, John Tucker. 1989. Íslensk-ensk orðabók. Reykjavík: Iðunn.

Tímarit.is. Landsbókasafn Íslands ‒ Háskólabókasafn: http://timarit.is.

Quasthoff, Uwe, Sabine Fiedler, Erla Hallsteinsdóttir. 2012. Frequency Dictionary. Icelandic. ISL. Leipzig: Leipziger Universitätsverlag.

Þórdís Úlfarsdóttir. 2013. ISLEX ‒ Norræn margmála orðabók. Orð og tunga
15:41–71. (Þetta hefti.)
Útgáfudagur
2020-07-15
Tegund
Ritrýndar greinar