From human-oriented dictonaries to computer-oriented lexical resources - trying to pin down words
Útdráttur
Orðabækur eru gerðar fyrir fólk en hins vegar eru mörg rafræn orðfræðileg málsöfn sett saman með tölvur í huga. Þeim er ætlað að geyma upplýsingar um form, notkun og merkingu orða á þann hátt að tölvur geti greint mannlegt mál á markvissan hátt, til þess að draga fram upplýsingar úr textum eða tali og til þess að draga ályktanir af þeim upplýsingum sem þannig er aflað. Ganga má út frá því að lifandi notendur viti ýmislegt fyrirfram, annaðhvort af skynsemi sinni eða almennri þekkingu, en aftur á móti hefur tölva enga fyrirfram gefna vitneskju. Í greininni er fjallað um ýmiss konar dæmigerðar merkingarfræðilegar upplýsingar í svonefndum orðanetum eins og WordNet (fyrir ensku) og DanNet (fyrir dönsku), en einnig í orðfræðilegum gagnasöfnum sem eru í grundvallaratriðum annarrar gerðar eins og SALDO (fyrir sænsku).