语言学论文哪里有?本项研究以现代蒙古语副词为研究对象,基于《100万词级现代蒙古语语料库》和《500万词级现代蒙古语语料库》,以传统语言学理论为指导,综合运用描写语言学、计算语言学和语料库语言学理论与方法,归纳分析蒙古语副词各项特征与功能的基础上建设了《现代蒙古语副词知识库》。
第一章现代蒙古语副词特征与功能
第一节现代蒙古语副词特征
现代蒙古语副词虽数量不多,但它是蒙古词汇不可或缺的部分,其特征复杂。要使计算机正确识别蒙古语副词,必须给计算机提供正确的语法、语义、语用等信息。为了更准确、更详细归纳描述蒙古语特征需要对以往研究成果进行比较。
本项研究中主要对以下著作进行比较后总结归纳了蒙古语副词特征。
《现代蒙古语》(1961)中认为“副词没有格变化或不完全变化……副词在句子中主要充当状语……蒙古语副词总体上具有中间性,有些副词具有完全的副词属性,而有些副词具有与名词、后置词混淆的不完全性。”
《蒙语语法》(1977)中认为“副词在句中主要出现在动词和形容词前单独或与相关词语共同充当一个句子成分。出现在动词谓语前主要充当状语。
《现代蒙古语法》(1983)中认为“有些副词无格变化,但有些副词不完全变化……因为副词主要表示动作的状态、地点、时间,所以副词在句子中主要充当状语……语义学基本特征是副词指性质的性质,即主要表示动作、状态的地点、时间、性质、时态、数量等。”
第二章《现代蒙古语副词信息词典》的建设
第一节《现代蒙古语副词信息词典》的建设原则、结构及收词
《蒙古语副词知识库》为蒙古文信息处理句处理和篇章处理工作提供蒙古语副词的语法、语义和语用等基础知识。它由《现代蒙古语副词信息词典》和《现代蒙古语副词规则库》组成。其中,《现代蒙古语副词信息词典》是面向信息处理的、在《100万》和《500万》知识资源基础上建设的、是为实现自动分析与自动生成现代蒙古语副词语句而研制的电子词典。它囊括了现代蒙古语副词的词法变化、句法功能、语义特征及语用特征等知识。构建《现代蒙古语副词信息词典》时,从关系数据库技术视角,运用特征结构方法,设计出易于机器处理的各种属性字段。该词典具有普遍使用性和可扩充性。
一、《现代蒙古语副词信息词典》的建设原则
1.完整性原则
现代蒙古语副词中有些副词有词法形态变化,并且在句子中可单独充当句子成分,有些副词则对句中相关词语增加语法意义,与其共同充当一个句子成分。在语义上副词不会直接表示事物,而是修饰其他词语,表示事物或动作的状态、时间、地点方向、程度、声音及情态特征等。因此,我们必须在该词典中将副词的词法变化,句法功能,语义特征及语用特征等都体现出来。
2.与《副词分库》相结合原则
《现代蒙古语副词信息词典》与《副词分库》都是蒙古语知识库的有机组成部分。因此必须将它们相结合。建设该词典时从《副词分库》中抽取了词条及“序号”、“蒙古语”、“拉丁字母”、“子类”、“例子”等五个属性字段,以此将两个词典相结合。
第三章《现代蒙古语副词规则库》的建设
第一节现代蒙古语副词规则阐释
现代蒙古语副词功能特征和《现代蒙古语副词信息词典》是归纳《现代蒙古语副词规则库》的基础。根据语料的实际情况,针对未标注词类信息的语料归纳规则。随着语料加工的精细化,不断对其进行细化改造。本节中阐述规则的种类、规则书写规范和规则使用字符等内容。
一、规则的种类
根据对语料的分析情况,将副词规则分为格变化副词规则、单独充当句子成分的副词规则和与其他词共同充当一个句子成分的副词规则等三大类。又将格变化副词规则分为工具格变化副词规则和属格变化副词规则等两类。将单独充当句子成分的副词规则分为充当句子主要成分的副词规则和充当句子次要成分的副词规则等两类。将与其他词共同充当一个句子成分的副词规则分为与前词共同充当一个句子成分的副词规则和与后词共同充当一个句子成分的副词规则等两类。一共总结出186条相关规则。归纳总结规则时以状态副词、时间副词、地点-方向副词、情态副词、程度副词、摹拟副词等顺序进行编写。
1.格变化副词规则
1.1工具格变化副词规则
@@HASI YASI Fc51 VP(Ve1+Fn1)→【HASI YASI】Db Fc51 VP(Ve1+Fn1)……
1.2属格变化副词规则
@@ONODUR Fc11 NP(Rb+Ne1)→【ONODUR】Dc Fc11 NP(Rb+Ne1)……
2.单独充当句子成分的副词规则
2.1充当句子主要成分的副词规则@@NP(Ac+Ne2)SERBES SERBES→NP(Ac+Ne2)【SERBES SERBES】Db……
2.2充当句子次要成分的副词规则
2.2.1充当定语成分的副词规则
@@IB NP(Ne1+Su)→【IB】Db NP(Ne1+Su)……
第二节现代蒙古语副词规则
一、格变化副词规则
现代蒙古语副词在词法方面不完全变化。主要有工具格变化和属格变化。其中,共总结出工具格变化副词规则5条,属格变化副词规则1条。文中例举副词子类两条规则,有的子类没有格变化形式,所以没有相关规则。有的子类语料中只出现一次,所以没有相关规则。
1.工具格变化副词规则
1.1状态副词
@@DALDAGVR Fc51 VP(Ne1+Fx11+Ve1)→【DALDAGVR】Db Fc51 VP(Ne1+Fx11+Ve1)@@HASI YASI Fc51 VP(Ve1+Fn1)→【HASI YASI】Db Fc51 VP(Ve1+Fn1)
1.2时间副词
@@JALG_A JALG_A Fc51 VP(Ne1+Fc21+Ve2+Fn1)→【JALG_A JALG_A】Dc Fc51VP(Ne1+Fc21+Ve2+Fn1)
@@GENEDTEHEN Fc51 VP(Ve2+Fn3+Vz)→【GENEDTEHEN】Dc Fc51 VP(Ve2+Fn3+Vz)
2.属格变化副词规则只有时间副词有属格变化。
@@ONODUR Fc11 NP(Rb+Ne1)→【ONODUR】Dc Fc11 NP(Rb+Ne1)
结论
本项研究以现代蒙古语副词为研究对象,基于《100万词级现代蒙古语语料库》和《500万词级现代蒙古语语料库》,以传统语言学理论为指导,综合运用描写语言学、计算语言学和语料库语言学理论与方法,归纳分析蒙古语副词各项特征与功能的基础上建设了《现代蒙古语副词知识库》。该知识库由《现代蒙古语副词信息词典》和《现代蒙古语副词规则库》组成。
首先,我们将现代蒙古语副词分为状态副词、时间副词、地点-方向副词、情态副词、程度副词和摹拟副词等六个子类,再按子类对每个词的特征与功能进行形式化描述,共总结出186条模型。其中,状态副词功能模型55条,时间副词功能模型42条,地点-方向副词功能模型10条,情态副词功能模型26条,程度副词功能模型34条,摹拟副词功能模型19条。
其次,阐述了建设《现代蒙古语副词信息词典》的建设原则、结构、收词、属性字段和属性值等方面内容。我们共设计出易于机器处理的29个属性字段。其中包括“序号”、“蒙古语”、“拉丁字母”、“子类”、“例子”等5个属性字段和“是否为兼类词”、“有无格变化”、“有无领属变化”、“有无级范畴变化”、“有无数范畴变化形式”、“能否构成新词”、“是否为派生副词”等7个词法属性字段,“能否单独充当句子成分”、“能否充当谓语”、“能否充当状语”、“能否充当定语”、“修饰什么词类”等5个句法属性字段,1个“是否有同形词”语义属性字段,“是否出现在句首”、“是否出现在句中”、“是否出现在句尾”、“可否重叠”、“前共现成分”、“后共现成分”、“其后可否接联系动词”、“其后可否接助动词”等8个语用属性字段,以及“词性”、“语料中出现次数”、“兼类次数”等3个其他属性字段。
最后,阐述了现代蒙古语副词规则的种类、书写规范、使用字符及具体规则等内容。我们共总结出186条现代蒙古语副词规则。其中包括格变化副词规则6条,单独充当句子成分的副词规则108条,与其他词共同充当一个句子成分的副词规则72条。
参考文献(略)