Íslenskur orðasjóður

  • Erla Hallsteinsdóttir Aarhus University
málheild, orðabók, málvísindi, Íslenska

Útdráttur

Í greininni er lýst tilurð og eiginleikum íslensks textagrunns - Íslensks orðasjóðs - sem unnið er að við Háskólann í Leipzig. Íslenskur orðasjóður er íslenskur textagrunnur með innbyggðu orðasafni sem samanstendur af u.þ.b. 250 milljónum orða og orðmynda úr íslensku nútímamáli. Íslenskur orðasjóður var unninn við Háskólann í Leipzig sem hluti af rannsóknarvinnu við verkefnið Leipzig Corpora Collection (http://corpora.informatik.uni-leipzig.de/). Textarnir í texta grunninum eru úr vefsíðusöfnun Landsbókasafns Íslands - Háskólabókasafns haustið 2005 og notendaumhverfið
var þróað við tölvunarfræðideild Háskólans í Leipzig.  Textagrunnurinn verður birtur á Veraldarvefnum til frjálsrar notkunar. Í greininni er notkunarmöguleikum textagrunnsins lýst, bæði sem orðasafns fyrir almenna notendur og sem rannsóknartækis við rannsóknir í hagnýtum og almennum málvísindum.

Heimildir

Beygingarlýsing íslensks nútímamáls. Vefslóð: http://www.lexis.hi.is/beygingarlysing.

Cysouw, Michael, Biemann, Christian og Ongyerth, Matthias. 2006. Using strong’s numbers in the bible to test an automatic alignment of parallel texts. Í: Michael Cysouw og Bernhard Wälchli (útg.): Parallel Texts: Using translational equivalents in linguistic typology. Special issue of Sprachtypologie und Universalienforschung (STUF), bls. 66–79.

Dornseiff, Franz. 2004. Der deutsche Wortschatz nach Sachgruppen. 8., völlig neu bearb. und mit einem alphabetischen Zugriffsreg. vers. Aufl. von Uwe Quasthoff. Berlin, New York: de Gruyter.

Erla Hallsteinsdóttir. 2004. En kort oversigt over islandsk ↔ tysk leksikografi. Í: LexicoNordica (11), bls. 51–65.

Erla Hallsteinsdóttir. 2005. Vom Wörterbuch zum Text zum Lexikon. Í: Ulla Fix, Gotthard Lerchner, Marianne Schröder og Hans Wellmann (útg.): Zwischen Lexikon und Text – lexikalische, stilistische und textlinguistische Aspekte, bls. 325–337. Leipzig: Verlag der Sächsischen Akademie der Wissenschaften zu Leipzig.

Erla Hallsteinsdóttir. 2006a. Phraseographie. Í: HERMES Journal of Language and Communication Studies (36), bls. 91–128.

Erla Hallsteinsdóttir. 2006b. Konzeption und Erstellung einer computergestützten zweisprachigen Phraseologiesammlung Isländisch – Deutsch. Í: Annelies Häcki Buhofer og Harald Burger (útg.): Phraseology in Motion. Proceedings zu Europhras Basel 2004, bls. 211–222. Baltmannsweiler: Schneider Verlag.

Erla Hallsteinsdóttir. Í prentun. Wörtliche, freie und phraseologische Bedeutung. Eine korpusbasierte Untersuchung des Vorkommens von freien und phraseolog- ischen Lesarten bei deutschen Idiomen. Í: Erika KrûiŽnik (útg.): Phraseologie in der Sprachwissenschaft und anderen Disziplinen. Akten der Europhras-Tagung in Strunjan/Slowenien, 19.–22. September 2005.

Erla Hallsteinsdóttir, Uwe Quasthoff og Monika Sajankova. 2006. Vorschlag eines phraseologischen Optimums für Deutsch als Fremdsprache auf der Basis von Frequenzuntersuchungen und Geläufigkeitsbestimmungen. Í: Linguistik online 27, 2/06: Neue theoretische und methodische Ansätze in der Phraseologieforschung, bls. 117–136. (Vefslóð: www.linguistikonline.de/27_06/hallsteinsdottir_et_al.pdf.)

Quasthoff, Uwe og Christian Biemann. 2006. Measuring Monolinguality. Í: Proceedings of the LREC-06 workshop on Quality assurance and quality measurement for language and speech resources, Genoa, Italy.

Quasthoff, Uwe og Matthias Richter. 2005. Projekt Deutscher Wortschatz. Í: Babylonia 3/2005. Vefslóð: http://www.babylonia-ti.ch/BABY305/quaride.htm.

Quasthoff, Uwe, Matthias Richter og Christian Biemann. 2006. Corpus Portal for Search in Monolingual Corpora. Í: Proceedings of LREC-06, Genoa, Italy.

Rapp, Reinhard. 1994. Die maschinelle Generierung von Wörterbüchern aus zwei- sprachigen Texten. Í: Susanne Beckmann og Sabine Frilling (útg.): Satz – Text – Diskurs. Akten des 27. Linguistischen Kolloquiums, Münster, 1993, Bd. I, bls. 203–209. Tübingen: Niemeyer.

Richter, Matthias, Uwe Quasthoff, Erla Hallsteinsdóttir og Christian Biemann. 2006. Exploiting the Leipzig Corpora Collection. Í: Proceedings of IS-LTC’06, Ljubljana, Slovenia.

Sigrún Helgadóttir. 2004. Mörkuð íslensk málheild. Í: Tunga og tækni, bls. 67–71. (Vefslóð: www.tungutaekni.is/news/sigrun2.pdf.)

Steinar Matthíasson. 2004. Þýsk-íslensk, íslensk-þýsk orðabók. Aukin og endurbætt útg. Reykjavík: Iðnú.

Útgáfudagur
2020-07-26
Tegund
Smágreinar