语言学论文哪里有?本文选取了疑问代词中隐性否定所占比例较高的“哪里”和“谁”作为研究对象,从固定搭配、句法位置和上下文特征角度提取疑问代词“哪里”和“谁”作为隐性否定成分的形式特征。
第一章绪论
1.3研究现状
1.3.1疑问代词“哪里”和“谁”的隐性否定研究概况
赵静贞(1981)、吕叔湘(1992)等人注意到了疑问代词的非疑问用法,其中包括反问用法。①近年来,随着对非疑问用法研究的不断深入,研究成果层出不穷。关于疑问代词在反问句中表达隐性否定的研究成果,大体上可以分为两方面:一是从本体研究角度进行共时描写与解释,对疑问代词的隐性否定用法进行归纳与分析,然后运用相关理论进行阐释和说明,以及从历时演变角度分析用法的变化或揭示某个结构的由来;二是从应用研究角度出发,或将研究发现应用于对外汉语教学,或进行汉外对比。
1.3.1.1本体研究
近年来,很多学者
近年来,很多学者都注意到了疑问代词特指反问句表否定的情况,并对其常用的几个形式进行简单归纳,或者将疑问代词作为反问句标记进行研究。李宇明(1990)认为“谁”类特指反问句在理解上有两种可能,分别是任指加否定和定指加否定。邱莉芹,邓根芹,顾元华(2000)分析了表否定用法“哪里”的句法结构,提出该用法本质上是“哪里”虚化的结果。于天昱(2004)对典型有标记反问句进行分类,从形式上分为十一类二十四种。张尹琼(2005)在“某指”类中谈到了“谁叫”“谁让”和“N不V谁V”类反诘式。陈天序(2007)借用数学集合的概念,讨论了疑问代词的否定用法在框架中的表现。刘芳(2011)将反问句的标记分为五大类二十五小类,认为反问句标记具有相对性、多重性和层级性。梁冠华(2015)分析了以副词类、疑问代词类、双音化词语和固定短语四类为代表的唯反问结构,其中提到“哪里”和“谁”时总结了“谁说+引述成分”等四种结构。程娥(2015)详细梳理了以疑问代词、指示代词、连词和语气词等为主要成分的反诘构式,并提出了部分消歧策略。蒲婉芝(2015)将隐性否定反问句分为是非型和特指型两大类,然后又细分为十四小类,其中将“谁”类反问句粗略地分为“VP谁”“谁+VP”和“谁VP谁”三种,并考察了疑问代词类隐性否定的使用频率。此外,李周(2008)等也简单提到了疑问代词类反问句的形式。
第三章隐性否定用法“哪里”的自动识别
3.1识别规则的设计
3.1.1相关概念
我们针对隐性否定用法“哪里”规则中的集合定义了相关概念,并用相应符号表示。
3.1.1.1固定搭配字符集
将确定型固定搭配收录到下面的固定搭配字符集1中,并用符号“GD1”表示。经统计,固定搭配字符共24个。
GD1={"/wp+哪里的话+/wp","/wp+哪里话+/wp","/wp+哪里嘛+/wp","/wp+哪里哦+/wp","扯到哪里去啦","扯到哪里去了","扯哪里去啦","扯哪里去了","除了……还能是哪里","脸面往哪里搁","脸往哪里搁","面子往哪里搁","说到哪里去啦","说到哪里去了","说哪里的话","说哪里话","说哪里去啦","说哪里去了","想到哪里去啦","想到哪里去了","想哪里去啦","想哪里去了","这是哪里的话","这是哪里话"}
由于歧义型固定搭配中的字符和作为独立形式使用的“哪里”排歧规则相互通用,因此我们将两者收录到下面的固定搭配字符集2中,并用符号“GD2”表示。经统计,固定搭配字符共4个。
GD2={"/wp+哪里+/wp","/wp+哪里啊+/wp","/wp+哪里哪里+/wp","/wp+哪里呀+/wp"}
将非否定用法“哪里”的固定搭配收录到下面的固定搭配字符集3中,并用符号“GD3”表示。经统计,固定搭配字符共74个。
第五章隐性否定用法“谁”的自动识别
5.1识别规则的设计
5.1.1相关概念
我们针对隐性否定用法“谁”规则中的集合定义了相关概念,并用相应符号表示。
5.1.1.1固定搭配字符集
把隐性否定用法“谁”的固定搭配分别收录到固定搭配字符集合4和固定搭配字符集5中,并分别用符号“GD4”“GD5”表示。“GD4”是确定型固定搭配集合;“GD5”是满足隐性否定上文特征后总结的固定搭配集合。经统计,GD4中有32个固定搭配字符,GD5中有4个固定搭配字符。
GD4={"/v+/m+谁不","/v+/n+谁不+/v","/v+得+/v+谁","/v+谁谁不","爱谁谁","不X(……,)谁X……","不然还有谁","不是……还有谁","除了……还v谁","除了……还有谁","还会+/v+谁","还可以+/v+谁","还能+/v+谁","叫谁+/v+得+A","看谁敢","看谁肯","看谁能够","看谁愿意","没+/n+谁+/v","你以为你谁","你以为你是谁","舍你其谁","舍我其谁","谁hold得住","谁HOLD得住","谁与争锋","我+/n(,)我怕谁","我是+/n(,)我怕谁","以为自己是谁","又会+/v+谁","又能+/p+谁","又能+/v+谁"}
5.2识别规则的验证
根据上文总结的规则和说明的规则匹配过程,本节展示了部分例句的验证过程,并通过大规模的语料验证规则是否具有科学性。
5.2.1验证过程示例
(1)*这时/r,/wp蒋介石/nh才/d粉墨登场/i,/wp宣称/v:/wp“/wp我/r不/d做/v总统/n,/wp【谁/r】做/v总统/n!/wp”/wp(《蒋氏家族全传)
例句(1)的结构形式是“不X,谁X”,与规则一中的字符串相匹配,因此“谁”直接标注为“隐性否定用法”。
(2)*比如/v洪水/n来/v了/u,/wp【谁/r】不/d往/p高处/nl躲/v?/wp有/v几/m个/q人/n能/v一头/d扎/v进/v水/n里/nd,/wp让/v自己/r淹死/v?/wp(《努尔哈赤》)
例句(2)的“谁”位于句首,后接副词“不”。按照本文的识别流程,从规则一开始执行,最终符合规则二十一,因此,“谁”直接标注为“隐性否定用法”。
(3)1623简/n问道/v:/wp“/wp【谁/r】还/d能/v解释/v怎么/r可以/v弄/v明白/a这些/r要点/n?/wp”/wp45/m分钟/q之后/nd,/wp玛丽/nh?简/wp决定/v结束/v这/r次/q讨论/v,/wp(《鱼》)
该句“谁”位于句首,后接副词“还”,并且“还”后接能愿动词,一般情况下“谁”是隐性否定用法。但是上句有疑问标志词“问道”出现,表明后续的话语内容为说话人的疑点所在。该例句从规则一开始匹配,最终能与规则十八相匹配,因此,“谁”标注为“非否定用法”。
第六章结论
为提高否定信息识别率和反问句识别率,提升机器翻译的质量,本文选取了疑问代词中隐性否定所占比例较高的“哪里”和“谁”作为研究对象,从固定搭配、句法位置和上下文特征角度提取疑问代词“哪里”和“谁”作为隐性否定成分的形式特征。
针对这两个研究对象,我们做了以下工作:
首先,考察了隐性否定用法和非否定用法的固定搭配形式,由于有些形式存在歧义,于是我们又制定了相应的排歧规则;其次,对于固定搭配规则无法处理的句子,需对比考察它们作为隐性否定成分和非否定成分的句法位置,研究发现隐性否定用法“哪里”位于句首、句中、句尾以及作为独立形式出现的概率分别为52.68%、12.42%、0.04%和83.66%,隐性否定用法“谁”位于句首、句中、句尾以及作为独立形式出现的概率分别为53.95%、14.39%、1.45%和0%;然后,对于句法位置规则无法处理的句子,需综合前后接词性、前后连接串、共现字符及固定搭配结构提取它们的上下文特征;最后,建立了固定搭配字符集、共现字符集、邻接字符集等13个集合,并将总结的规则进行调整优化,分别形成隐性否定用法“哪里”和“谁”的17条和21条识别规则。
根据我们制定的规则,以CCL语料库、语料库在线及MLC语料库为验证语料库,得出隐性否定用法“哪里”和“谁”的识别数据。从现有数据及识别结果看,CCL语料库和语料库在线的实验效果较为理想,F值均达到了92%以上,MLC语料库准确率、召回率和F值相对较低,还值得进一步研究。若我们对MLC语料库中的语料进行单独处理,把“来”“要”和“有”从隐性否定用法“谁”的后连接串中剔除,则准确率、召回率和F值分别为89.41%、86.36%和87.86%,总体上提升了机器识别的性能。从整体看,通过规则匹配的方式能够较好地识别疑问代词在句中的隐性否定义。
参考文献(略)