本文通过多义判断的问卷调查来讨论多义词义项的可区分度,使用判断正确率作为衡量可区分度的指标。本文的贡献在于:1.讨论并实现了一种利用问卷调查测量义项可区分度的方法;2.该方法为多义词义项可区分度的研究提供了可以参照的数据结果;3.基于多义词义项可区分度结果,从语法功能的实现、语义组合限制的强弱、语义角色的体现等方面,探讨了义项区别特征对于多义词义项可区分度高低的影响。本文研究主要发现如下:1.语法功能特征主要作用于多义动词、兼类词,语义组合特征或语义角色特征作用于多义名词、动词、形容词
......
第1章绪论
计算语言学关注多义词的分布特征,将词在使用中的上下文纳入考量,但多停留在形式方面,理论的解释价值不足。汉语词汇研究较多关注词本身性质,对词与词的外部互动关注不够。肖航的“标注一致性实验”合理利用了问卷参与者的共性输出,开始真正关注多义词义项的辨析难度这一命题。他提出的“包含、重叠、相离”三种多义词义项关系,将多义词各个义项放入共时层面、同等地位考量,然而肖文的结论更多是从纯意义层面的分类,对于义项间的形式差异并未能有所解释,关照到全体多义词时体现出一定的局限性。我们认为,对于多义词的研究,关涉对象应该是相对全面的,应该对多义词义项关系的共性、特性都有所解释。
.......
第2章研究对象、内容及方法
2.1研究对象及内容
如上两例所示,第二个义项均由第一个义项通过隐喻引申而来,然而我们仍感觉在话语层面这两个多义名词的义项区分难度不一样,这是因为除了在词典中,大多数情况下词都是以相互组合的形式在句子中存在的,义项辨析的难易程度由词典释义和实际使用共同决定。至此,我们对可区分度有了基本认识,我们认为,可区分度是客观存在和人类主观认知结合的产物,在语言使用中,多义词义项越是容易区分,可区分度就越高;越是难以区分,可区分度就越低。词典多义词义项区别特征的类型“区别特征”是语音学术语,最初由雅各布逊提出,区别特征指“有区别音位的作用的发音特征”,本文借用语音学中区别特征的概念来分析词义,以概括描写多义词义项间的对照或对比特征,多义词区别特征指能够区别义项的语言学特征。王政红(1989)曾指出,“传统研究未能解释出多义词各个语义的外部联系——与其他词语的组合能力和组合关系,以及在语法结构中的适应能力2。”实际上,系统功能语言学的搭配理论、生成语义学的选择限制(selectional如上两例所示,第二个义项均由第一个义项通过隐喻引申而来,然而我们仍感觉在话语层面这两个多义名词的义项区分难度不一样,这是因为除了在词典中,大多数情况下词都是以相互组合的形式在句子中存在的,义项辨析的难易程度由词典释义和实际使用共同决定。至此,我们对可区分度有了基本认识,我们认为,可区分度是客观存在和人类主观认知结合的产物,在语言使用中,多义词义项越是容易区分,可区分度就越高;越是难以区分,可区分度就越低。
2.2研究方法法
为了研究多义词区别特征类型,我们设计了句法语义分析框架,对词典多义词的语义结构进行体系化描写,该框架将用于问卷设计,并在具体分析时将区别特征于可区分度高低进行关涉,为多义词义项的可区分度影响因素的提炼服务,从组合成分变量设置的原则,到多义词义项可区分度的评价分析,该体系贯穿本文研究。王惠(2003)曾论证,从句法组合特征、搭配语义限制两类特征都对多义名词的释义有着重要作用。袁毓林(2013)以生成词库论和论元结构为依据,融合多层面的语义及其关联知识,建立了汉语实词的语义知识体系,从搭配连接、选择限制关系、情感评价色彩方面描述实词的语义结构,具体地刻画了实词的语义结构和搭配特点。本文对义项的描写借鉴他们的研究成果,通过观察数据和词典释义,将义项区别特征分为语法功能特征、语义组合限制特征、语义角色特征三大类,该框架将在在第三章进行详细论述。
........
第三章多义词义项句法语义框架........................................17
3.1语法功能特征...................................................17
3.2语义组合限制特征...............................................21
3.3语义特征...................................................26
第四章问卷调查估计义项可区分度............................................................30
4.1区别特征标注及统计...................................................................................30
4.2例句编写.......................................................31
4.3问卷调查过程...................................................32
第五章问卷结果分析......................................................37
5.1可区分度总体情况概述...........................................37
5.2可区分度与语法功能特征.........................................39
........
第五章问卷结果分析
5.1可区分度总体情况概述
本次问卷调查结果共收集两个指标:一个是正确率,一个是信心指数。如章节4.3.1中介绍,正确率指判断两个例句中的词意义不同的人数占总人数的比例,信心指数为作出此判断的确定程度加权取和,确定程度打分低,代表做判断时有所犹豫。本次问卷共计428个词,其中名词176个,动词109个,形容词35个,兼类词108个,各类词内部得分情况较为均匀。我们对每类多义词的正确率内部取平均值,作为该类词的正确率情况。统计结果显示,在正确率方面,形容词0.7257>兼类词0.6885>动词0.6473>名词0.6307。我们也统计了正确率同信心指数的对应分布情况,多义名词、动词、形容词、兼类词的两指标分布情况如下图。总的来说,混合型区别特征多义词的可区分度普遍高于单一型区别特征的多义词。在单一型区别特征的多义词中,语法功能特征的可区分度要优于语义组合限制特征;在组合型区别特征的多义词中,有语义角色区别特征的多义词的可区分度明显优于平均水平。我们认为,这可能是因为语法功能特征是“形式”特征,形式特征是规则,相对固定、变化小;语义选择限制特征是“意义”特征,意义特征不对应某种语言形式规则,更为复杂多变。另外,语法功能和语义角色特征可以分析为在一个短语或句子范围内的语言特征,语义组合特征可能对应篇章或者语用特征,本文例句为单句,相较之下,语义组合特征不如语法功能特征易于发挥。
5.2可区分度与语法功能特征
王惠、朱学锋(1998)曾指出名词各子类在实际语法功能中存在差异,名词各子类内部的语法功能也不尽相同。举例来说,个体名词能够单独做主语的比例是98%,而无量名词能够单独做主语的比例仅为92.6%,又如个体名词能够受名词直接修饰的比例是58.7%,而抽象名词能够受名词直接修饰的比例则仅为39.7%。这表明语法功能的差异,在名词子类之间、名词子类内部都是客观存在的。我们试图探讨这种词类内部的语法功能的差异,是否在多义名词义项的可区分度上有所体现。问卷调查结果显示,可区分度在名词子类间确实出现了较为明显的不同,在平均正确率上具体表现为:个体名词<抽象名词<个体/抽象名词<物质名词<无量名词。我们选取了有代表性的多义名词进行分析,试图为这个结果寻找一些解释。
.......
第六章结语
多义词义项可区分度同区别特征类型有一定关系,形式特征强的多义词义项可区分度平均高于意义特征强的多义词,这可能跟语法规则的固定性、有限性,语法功能特征可以更好地在短语或单句范围内实现有关;4.语法功能的实现、语义组合限制的强弱影响可区分度:义项语法差异在话语层面的实现程度越高,可区分度较高;语义组合限制越强,可区分度越高;5.语义角色差异的存在增强可区分度:在同等条件下,存在语义差别能辅助人们进行义项判断。
参考文献(略)
参考文献(略)