Textasöfn og setningagerð: greining og leit

  • Eiríkur Rögnvaldsson Háskóli Íslands
málheildir, dæmasetningar, málfræðileg mörkun

Útdráttur

Í þessari grein er fjallað um textasöfn sem setningafræðilega heimild, og leit að setningafræðidæmum í textasöfnum. Undanfarna áratugi hafa verið uppi mjög mismunandi viðhorf til gildis textasafna í setninga¬fræðilegri umræðu og röksemdafærslu, en bent er á að þann ágreining má að verulegu leyti rekja til mismunandi skoðana á því hvert viðfangsefni málfræðinnar sé. Einnig er fjallað nokkuð um margvíslegan vanda við túlkun þeirra upplýsinga sem textasöfn veita – ekki síst túlkun á þögn textanna um tilteknar setningagerðir. Meginhluti greinarinnar fjallar um möguleika á setningafræðilegri dæmaleit í mismunandi greindum íslenskum textasöfnum; hráum texta án nokkurra sérmerkinga, texta með beygingarlegri greiningu, og texta þar sem helstu setningarliðir og setningafræðileg hlutverk hafa verið greind. Gagnamarkarar hafa nú verið þjálfaðir á íslenskum textum, og í ljós hefur komið að vegna ríkulegs beygingarkerfis málsins og stórs markamengis gagnast beygingar¬leg mörkun mjög vel við leit að ýmsum setningagerðum.

Heimildir

Ásta Svavarsdóttir. 2006. Tilbrigði í setningagerð. Orð og tunga 8:156–157.

Ásta Svavarsdóttir. 2007. Talmál og málheildir – talmál og orðabækur. Orð og tunga 9 (þetta hefti).

Bergljót S. Kristjánsdóttir, Eiríkur Rögnvaldsson, Guðrún Ingólfsdóttir og Örnólfur Thorsson (ritstj.). 1996. Orðstöðulykill Íslendinga sagna. [Geisladiskur.] Mál og menning, Reykjavík.

Chomsky, Noam. 1957. Syntactic Structures. Mouton, Haag.

Chomsky, Noam. 1965. Aspects of the Theory of Syntax. MIT Press, Cambridge, Massachusetts.

Eiríkur Rögnvaldsson. 1994-95. Breytileg orðaröð í sagnlið. Íslenskt mál 16–17:27–66.

Eiríkur Rögnvaldsson. 1996. Frumlag og fall að fornu. Íslenskt mál 18: 37–69.

Eiríkur Rögnvaldsson. 1998. Heimildatúlkun í sögulegri setningafræði. Baldur Sigurðsson, Sigurður Konráðsson og Örnólfur Thorsson (ritstj.): Greinar af sama meiði, bls. 317–334. Rannsóknarstofnun Kennaraháskóla Íslands, Reykjavík.

Eiríkur Rögnvaldsson. 2000. Setningarstaða boðháttarsagna í fornu máli Íslenskt mál 22:63–90.

Eiríkur Rögnvaldsson. 2002. ÞAÐ í fornu máli – og síðar. Íslenskt mál 24:7–30.

Faarlund, Jan Terje. 1990. Syntactic Change. Toward a Theory of Historical Syntax. Mouton, Berlín.

Falk, Cecilia. 1995. Lexikalt kasus i svenska. Arkiv för nordisk filologi 110:199–226.

Halldór Ármann Sigurðsson. 1989. Verbal Syntax and Case in Icelandic. In a Comparative GB Framework. Doktorsritgerð, Lund Universitet, Lund.

Hrafn Loftsson og Eiríkur Rögnvaldsson. 2006. A Shallow Syntactic Annotation

Scheme for Icelandic Text. Technical Report RUTR-SSE06004, Department of Computer Science, Reykjavik University, Reykjavík.

Höskuldur Þráinsson. 1979. Complementation in Icelandic. Garland, New York.

Höskuldur Þráinsson. 2005. Setningar. Handbók um setningafræði. (Íslensk tunga III.) Almenna bókafélagið, Reykjavík.

Jörgen Pind (ritstj.), Friðrik Magnússon og Stefán Briem. 1991. Íslensk orðtíðnibók. Orðabók Háskólans, Reykjavík.

Kromann, Matthias Trautner. 2003. The Danish Dependency Treebank and the DTAG Treebank Tool. Joakim Nivre og Erhard Hinrichs (ritstj.): Proceedings of the Second Workshop on Treebanks and Linguistic Theories (TLT 2003), bls. 217–220. Växjö University Press, Växjö.

Lightfoot, David S. 1979. Principles of Diachronic Syntax. Cambridge University Press, Cambridge.

Maren Albertsdóttir og Stefán Einar Stefánsson. 2004. Beygingar- og málfræðigreinikerfi. Samspil tungu og tækni, bls. 16–19. Menntamálaráðuneytið, Reykjavík.

McEnery, Tony, og Andrew Wilson. 1996. Corpus Linguistics. Edinburgh University Press, Edinburgh.

Mørck, Endre. 1992. Subjektets kasus i norrønt og mellomnorsk. Arkiv för nordisk filologi 107:53–99.

Nivre, Joakim. 2002. What kinds of trees grow in Swedish soil? A comparison of four annotation schemes for Swedish. Erhard Hinrichs og Kiril Simov (ritstj.): Proceedings of the First Workshop on Treebanks and Linguistic Theories (TLT 2002), 20–21 September 2002. Sozopol, Bulgaria.

Osenova, Petya, og Kiril Simov. 2003. The Bulgarian HPSG Treebank: Specialization of the Annotation Scheme. Joakim Nivre og Erhard Hinrichs (ritstj.): Proceedings of the Second Workshop on Treebanks and Linguistic Theories (TLT 2003), bls. 129–140. Växjö University Press, Växjö.

Sigríður Sigurjónsdóttir og Joan Maling. 2001. Það var hrint mér á leiðinni í skólann: Þolmynd eða ekki þolmynd? Íslenskt mál 23:123–180.

Sigrún Helgadóttir. 2007. Mörkun íslensks texta. Orð og tunga 9 (þetta hefti).

Þórunn Blöndal. 2005. Lifandi mál. Inngangur að orðræðu- og samtalsgreiningu. Rannsóknarstofnun Kennaraháskóla Íslands, Reykjavík.

Útgáfudagur
2020-07-26
Tegund
Smágreinar