语言学论文哪里有?本研究构建的鄂尔多斯地区蒙汉语码转换口语语料库是实验性地方口语语料库平台,该平台将为研究鄂尔多斯地区蒙汉语码转换研究人员提供数据资源和分析平台。
绪论
2.创新点
语码转换研究中重理论少实例是现状,基于语料库的蒙汉语码转换研究也是寥寥无几。因此以语料库语言学为基础,把语料库的思维带入语码转换的研究中,将会为二者提供全新的发展空间。
通过语料库所提供的例句和应用平台所提供的统计分析结果可揭示蒙汉语码转换的语音、词汇、句法、语用等不同层面所呈现的规律、特点和变化,从多视角深入研究蒙汉语码转换现象,具有方法论意义上的创新性。
鄂尔多斯地区蒙汉语码转换口语语料库是将语言学和计算机科学技术相结合,打造的具有民族风格特点的地方性语料库。该语料库不仅可以促进该方言的保护和传承,还可以为不同领域的研究人员从不同的视角研究鄂尔多斯土语提供方法和数据资源。
第三章 蒙汉语码转换口语语料库管理系统
一 语料库系统设计
1.语料库平台设计
经过田野调查和社交媒体平台,本研究采集了380分钟的蒙汉语码转换自然会话语音数据,并从中选取280分钟的语音数据转写生成了具有48711词3747句子的文本语料。为了更好地管理和应用这一数据资源,采用nodejs、vscode,jdk、idea等前端和后端开发工具设计实现了基于B/S架构的语料库管理及应用系统。基于B/S 架构的应用系统的优点是降低了对客户机的依赖性,可以随时随地在不同的客户机上进行操作。另外,基于B/S 架构的应用系统提供了更多的开放性和集成性,为系统的使用提供了更多的便利。如图3.1所示。
蒙汉语码转换口语语料库管理系统采用了MVC三层框架结构,即:表示层、业务逻辑层和数据持久层。其中,表示层是系统的页面显示部分,负责获取用户的动作指令和显示用户请求的信息。业务逻辑层负责根据接收的用户指令进行逻辑处理,将用户需要的资源发送到浏览器端。数据持久层负责数据处理的具体实现,并向业务逻辑层提供数据处理的服务和接口。数据库管理系统三层架构降低层间耦合度的同时提高了层内聚合度。
第四章 鄂尔多斯地区蒙汉语码转换的类型和特点
一 鄂尔多斯地区蒙汉语码转换的类型
语码转换的分类一直是语码转换研究一个重要的任务和研究内容。但如何对语码转换进行分类,学者们持有不同的观点。多数研究者以语码转换嵌入的位置以及语码转换的形式为依据进行类型划分。本研究在对鄂尔多斯地区蒙汉语码转换的类型分类中使用了Poplack的关于语码转换的分类方法。
Poplack根据语码转换的结构层次将语码转换分为句内语码转换(intrasentential code-switching)、句间语码转换(sentential code-switching)和附加语码转换(tag sentential)三个类型1。本研究通过对所采集自然会话口语语料的统计分析(统计结果如表4.1所示),来探讨鄂尔多斯地区蒙汉语码转换的类型划分问题。
二 语码转换的社会分布特点
不同社会群体的语码转换现象存在着差别。影响语码转换的原因是多种多样的,有内在的性别、年龄、文化程度等方面的影响,也有外在的语言环境、社交范围等方面的影响。不同的性别在语言使用方面体现出不同的差别,是普遍存在于人类语言社会的客观事实,也是社会语言学的重要问题之一。年龄也是研究语言问题的重要指标之一,不同年龄段的人具有的语言能力、使用的语言变体、具备的语言态度差别很大,因此年龄是各项语言差异研究中最直观的影响因素。除此之外,文化程度和职业也是影响语码转换的重要因素。下面将从受试者的性别、年龄、文化程度和职业等角度来进行分析。
1.语码转换的性别差异
性别的差异在语言学研究中一直都是一个活跃度较高的变项。在进行语料采集的过程中,特别关注了不同性别的说话人蒙汉语码转换的能力。一般而言,男女群体在语言使用上存在一定的差异,统计结果如图4.3所示。
在蒙汉语码转换口语语料库中,使用语码转换的句子共有972句。男性使用语码转换的句子共388句,占39.92%;女性使用语码转换的句子共584句,占60.08%。由此可知,女性的语码转换次数大于男性。研究发现女性的语言能力较强、对语码转换更敏感,更注意不同语言变体新形势的交际意义。在语言学习中,对实用性较强的语言,女性的学习动力更强,语言能力也更强,使用频率也越高,因此她们在会话中更容易发生语码转换。
结语
语码转换是语言接触的必然结果,近年来语码转换研究受到语言学界的广泛关注。在语码转换研究中,汉语和英语的语码转换研究较多,但是汉语和少数民族语言的语码转换研究却很少。基于这一现状,本文研究了鄂尔多斯地区双语者的蒙汉语码转换现象。为了深入研究鄂尔多斯地区蒙汉语码转换的类型和特点,本文构建了鄂尔多斯地区蒙汉语码转换口语语料库。这将为为语码转换和基于语码转换的相关研究提供数据资源和分析系统。
本文介绍了鄂尔多斯地区蒙汉语码转换口语语料库的构建过程。为了采集更加全面、真实和丰富的口语语料,采用了田野调查法和在线访谈法,在鄂尔多斯市伊金霍洛旗、乌审旗、鄂托克前旗、鄂托克旗、杭锦旗等地共采集了34段语音数据,共计约380分钟。将每段录音保存为一个单独的wav格式文件,并进行基本信息的标注,并方便下一步的转写和标注。在进行语音数据的转写时,采用人工转写方式将录音里的内容如实转写为文本,不增加、不删减。经过统计得出,转写的文本语料共有48711个词和3747个句子,其中含有语码转换的句子共有972句。在音频数据库和文本数据库构成的基础上,采用了nodejs、vscode、jdk、idea等前端和后端开发工具设计实现了基于B/S架构的语料库管理及应用系统。该系统主要实现了辅助转写、查询统计、文本标注、维护管理功能以及用户新增、修改、删除、授权等功能。
参考文献(略)