上海论文网提供毕业论文和发表论文,专业服务20年。

蒙古语形容词短语语义角色 自动识别思考

  • 论文价格:150
  • 用途: 硕士毕业论文 Master Thesis
  • 作者:上海论文网
  • 点击次数:1
  • 论文字数:56966
  • 论文编号:
  • 日期:2024-11-12
  • 来源:上海论文网

语言学论文哪里有?本文基于多层标注语料库主要进行了形容词短语语义角色计量研究和形容词短语语义角色自动识别实验。多层标注语料库规模为10000句,共138671个词,平均句长为13.87。

第一章  绪论

1.2 研究现状

1.2.1形容词短语研究

形容词短语是指以形容词为主体,具有跟形容词相同的语法功能的短语,也有人称之为形容词性短语1。汉语形容词短语研究方面,主要开展了形容词和形容词短语的定义、形容词短语的结构、句法功能、内部结构特征等研究。邢福义(1988)在文中论述了形容词短语是以形容词为主体的短语、根据形容词的基本特点区分形容短语等问题。李谱英(1989)在文中论述了形容词短语结构形式、语法功能及误用释例,总结出了形容词短语有“状+形”“形+补”“状+形+补”三种基本结构形式和联合、主谓等特殊结构形式,并提到了形容词具有作谓语、定语、状语、补语等一般语法功能和作主语、宾语、句子等特殊语法功能。周强等(1996)提出了汉语短语标注的基本标记集,并从句法功能和结构组成方面对不同短语进行了研究,文中制定了名词性短语(np)、名词性准短语(nbar)、形容词性短语(ap)、形容词性准短语(abar)等15种短语分类标记,并归纳出形容词性短语具有作谓语、补语及定语等句法功能,结构组成方面常见的有状中、述补、述宾及联合结构等。齐沪扬等(2001)论述了形容词与形容词短语的句子成分功能差异。刘丹青(2005)从形容词能否独立成为词类、形容词短语的概念等方面进行了论述。郭洁(2021)论述了形容词短语内部结构功能特征,在形容词和名词范畴之间建立了短语结构的平行性,并在文中预测了形容词和动词短语在内部结构方面也具有平行性。

第三章  形容词短语语义角色特征计量研究

3.1  形容词短语语义角色分布特征统计

本节主要从形容词短语语义角色大类、小类分布特征,形容词短语语义角色长度分布特征,形容词短语语义角色内部结构关系分布特征、与句子成分的对应等方面对形容词短语语义角色分布特征进行统计研究。

3.1.1  形容词短语语义角色分布特征统计分析

蒙古语形容词短语信息库(以下简称“信息库”)收录了2646个形容词短语,其中充当语义角色的形容词短语有1047个,其余1599个形容词短语在本研究所使用的多层标注语料库中不充当语义角色。为回答蒙古语中形容词短语可以充当哪些语义角色、充当哪类语义角色的概率最高?形容词短语语义角色覆盖的内部结构关系有哪些?覆盖哪个短语内部结构关系最多?形容词短语语义角色的长度分布如何?形容词短语语义角色类别和内部结构关系之间对应关系如何?与句子成分对应情况如何?等问题本文做了如下几个方面的统计分析。

基于信息库本文首先对形容词短语语义角色大类进行了统计。按出现的频次从高到低排序为饰体形容词短语语义角色、客体形容词短语语义角色、主体形容词短语语义角色、邻体形容词短语语义角色,其中饰体形容词短语语义角色共出现592 次,占形容词短语语义角色的56.54%,这表明形容词短语在语料库中主要饰体形容词短语语义角色。在对形容词短语语义角色大类进行统计分析的基础上,本文还对形容词短语语义角色小类进行了统计分析。

语言学论文怎么写

第四章  形容词短语语义角色识别实验及结果分析

4.1 形容词短语语义角色识别规则描述方法与标记集

本文采用复杂特征描述方法归纳总结了蒙古语形容词短语语义角色识别规则。主要包括词性、形态变化、短语内部结构关系、语义类、形容词短语语义角色后词(一个词)词性、形容词短语语义角色的支配词词性、支配词语义类等内容。

形容词短语语义角色识别规则归纳过程中,主要参考了《信息技术—传统蒙古文词语语义分类体系及其标记集》(请参考附表3)、《信息技术—传统蒙古文语义角色分类体系及其标记集》(请参考表2.5)、《蒙古语短语结构信息库相关研究》(请参考表2.3和表2.4)中提出的分类体系及其标记集。规则中使用的自定义标记说明如下:

R1- 表示形容词短语语义角色识别规则的顺序。

APsed- 指的是主题形容词短语语义角色,形容词短语充当其它类别的语义角色时,填写相应的标记。

As – 表示构成当前形容词短语语义角色的词语语义类,填写相应的标记。

Ad – 表示当前形容词短语语义角色的内部结构关系,填写相应的内部结构关系标记。

Am – 表示当前形容词短语语义角色最后一个词的形态变化。有形态变化时,填写相应的标记,没有形态变化时,填写“0”。

An – 表示当前形容词短语语义角色后面(一个词)的词,填写相应的标记。

Av – 表示支配当前形容词短语语义角色的谓词,填写相应的标记。

Avs – 表示支配当前形容词短语语义角色的谓词语义类,填写相应的标记。

“|” - 表示“或”的意思。

4.2 形容词短语语义角色识别规则

目前有基于统计的经验主义方法和基于规则的理性主义方法等几种方法。基于规则的理性主义具有较强的概括性,可以运用到尚未涉及的新研究的同时可以形式化描写出大量的语言学知识。由于当前的研究基础、研究现状、技术条件等原因,本研究选择了基于规则的蒙古语形容词短语语义角色自动识别方法。

利用复杂特征描述方法,基于蒙古语形容词短语信息库中的1047条形容词短语语义角色归纳了675条形容词短语语义角色识别规则。下面通过列举逐一说明17种形容词短语语义角色识别规则。

语言学论文参考

第五章  总结与展望

本文基于多层标注语料库主要进行了形容词短语语义角色计量研究和形容词短语语义角色自动识别实验。多层标注语料库规模为10000句,共138671个词,平均句长为13.87。本研究主要从分布特征、语义类、格变化、支配词语义类等方面对形容词短语语义角色进行了研究。

1. 将原有的5000句规模语料库扩充为10000句,并依次进行了固定短语、词法、短语类型及内部结构关系、语义类、句子成分、语义角色等多层标注。

2. 基于多层标注语料库构建了蒙古语形容词短语信息库,该信息库共有2646条形容词短语,其中1047条形容词短语在多层标注语料库中充当了语义角色。

3. 形容词短语与4大类语义角色的17个小类语义角色对应,主要充当饰体类中的性状语义角色。

4. 通过形容词短语语义角色长度分布特征计量研究发现,形容词短语语义角色的长度为2-24个词,其中长度为2-3个词的居多。形容词短语语义角色的长度分布与混合负二项(mixed  negative  binomial distribution)分布模型拟合成功且效果较好。因此,蒙古语形容词短语语义角色长度分布是有一定的规律性,服从经典概率分布模型。

5. 形容词短语语义角色内部结构关系覆盖了7种短语内部结构关系,其中定体关系占指导作用。除主题语义角色内部结构关系主要以辅助关系为主、原因语义角色主要以体述关系为主以外其它15种形容词短语语义角色均以定体关系为主。

6. 通过对形容词短语语义角色与句子成分的对应关系的统计发现,与状语成分对应情况最多。这主要跟形容词的句法功能有关,形容词在句中主要作定语或状语。

7. 统计形容词短语语义角色语义类,发现除时间值(Ac)语义类主要限制时间形容词短语语义角色、空间值(Ao)语义类主要限制空间形容词短语语义角色以外,其余的17种形容词短语语义角色的语义类主要以物性值(Ab)为主。

参考文献(略)

123
限时特价,全文150.00元,获取完整文章,请点击立即购买,付款后系统自动下载

也可输入商品号自助下载

下载

微信支付

查看订单详情

输入商品号下载

1,点击按钮复制下方QQ号!!
2,打开QQ >> 添加好友/群
3,粘贴QQ,完成添加!!