本文是计算机论文,教育本体是将本体技术加入到现代化教育领域中,以实现信息化、数字化、智能化、个性化的教育体系,建设人人皆学、处处能学、时时可学的学习型社会[2],实现更加开放、更加普适、更加智能、更加平衡、更加可持续的教育。我们知道互联网(网络)对于学习者来说,提供了一条获取无限信息和知识的途径,为个性化学习、远程学习、远程协作等提供了资源支撑。而基于网络的教育同样提供了诸多便利,比如,可以提供基于网络的课程和远程教学服务,可以低成本、高效地存储和分发课程材料,可以提供推荐阅读的超链接,可以作为线上访问的数字图书馆,以及可以提供与课程相关的参考资料来源。但是就是因为这样的多样性,也给知识的挖掘和管理,知识的同步和整合,以及不同教学工具之间的协调和对接,带来了巨大的挑战。而在线下教育系统中,地域的差异,师资力量的差异,教学资源的差异,教学设备的差异,教育过程和教育管理的差异,同样给知识的传播和重用带了挑战。因此,下一代教育应该将注意力放在理论和内容的智能化和适应性上,应该更加关注互操作性,知识的重用和共享,知识的组织和管理,以及不同程度的、不同地域的教育过程和教育资源的整合等问题。
.........
第一章绪论
本体作为一种明确化的、可共享的形式化规范概念体系,可以在知识的管理、传播和重用上起到重要作用。首先,本体可以看作是一种图(状)数据库,可以对知识进行存储和管理,并且这种图数据库可以存储更加复杂和多样的知识。其次,本体中的概念是明确化的,可以给用户(包括教师和学生)提供统一、可靠和准确的知识,从而避免地域、文化不同造成的知识差异,以便于知识的重用和传播。还有,本体可以进行修改、更新和自由扩展,因此将本体应用于教育领域中,更能有效地实现教育的信息化和智能化。下面本文对本体进行深入地讨论。首先,对于线上教育来说,虽然网络资源极其丰富,但是其蕴含的信息不仅非常复杂,还存在大量无效信息或者噪声信息,因此需要对这些资源进行处理、分类并关联整合,筛选出满足教育工作所需求的知识,来使得教育更加信息化、智能化。其次,除了网络上的资源,在线下教育工作中,教学教材、辅导教案以及个人的知识笔记,同样蕴含着大量的知识、但同样因为教师和学习者的不同和差异,这些知识也会非常的复杂,富有多样性。本文提出将教育本体应用到教育领域中,来实现教育的信息化和智能化。本文包括七个章节。第一章节讨论了课题的研究背景和主要研究内容;第二章分析了与本文课题相关的研究工作及其存在的不足;第三章讨论了教育本体的自动构建和扩展框架,并在物理教材上构建了一个物理教育本体;第四章研究了针对教育本体构建中进行抽取时多头问题的解决方法;第五章讨论了针对针对教育本体构建中进行知识抽取时多关系问题的解决方法;第六章提出了一种基于图神经网络的共指消解模型;第七章是对已有工作的总结并分析了今后相关研究可行的发展方向以及需要解决的问题。
.......
第二章 预备知识和相关工作
2.1学习对象
学习对象的核心思想不是其形式,而是其可重用性和可共享性。学习对象支持并促进在线教育内容的重用和共享。学习对象之间可以相互结合用于不同的学习目的。例如,显示地球的图像可以在地理、天文学和媒体科学等领域的不同课程中重复使用。学习对象的可重用性之所以重要,有几个原因[36]:首先,开发高质量的教育内容需要花费大量的时间和精力。第二,不同的教育组织和机构可能会教授相同的主题,在这种情况下,他们很可能会发展出相似的教学内容。第三,重复利用现有的包含共有知识的教材,可以逐渐促进各组织中部分教育方法的统一,有助于提高学生的共同教育水平和不同教育机构之间的流动性。第四,在不同的组织中重复使用一些学习对象,随着时间的推移将会减少人力资源和开发学习资源所需的成本[37]。第五,学习对象不仅可以被不同的教育机构重用,也可以在辅导培训中重用。最后,在整个教育过程和教育管理中,所用到的教学手段、工具等等,需要与多元化的知识关联起来,整合成一个全面的智能教育系统,以便于形成一个个性化教学以及多元化教育的体系。因此就迫切需要引入一些关键技术,智能地挖掘、管理、关联和组织有效知识。
2.2本体工程与知识图谱的结构
类似,本体也可以描述为面向语义的图,概念可以看成是节点,关系可以看成是链接/边,规则可以看成是约束、演变规则等等。与知识图谱相比,本体是形式化的、明确的定义。例如,在知识图谱中,节点和节点之间的链接(关系)总是模糊的,语义上不清楚的。相反,在基于本体的图中,节点在语义上是清晰明确的,并且关系也很明确。而本体的另一个特点就是可共享性,因此本体更适合于描述更加复杂的可传递的知识(比如教育领域中的知识)。本章主要对本文中涉及到知识范围,研究对象、以及基本的方法和模型进行了分析和回顾。本课题主要是针对教育领域中本体构建进行了研究,因此介绍了教育领域中学习者主要面对的学习对象的分类,然后研究了本体工程的相关知识,包括分体定义,本体结构和本体分类。其次,对本体构建中涉及到的关键技术进行了研究,其中包括本体扩展、知识抽取、共指消解等等。最后,对这些关键技术中所用到最新的深度学习方法和模型进行了研究。
简单的本体样例
第三章教育本体的自动构建和扩展框架.................................27
3.1引言..................................27
3.2相关工作.................................30
3.3本体自动构建方法.................................33
3.4本体扩展方法.................................35
第四章 教育本体构建中解决多头问题的知识联合抽取.................................55
4.1引言.................................55
4.2相关工作.................................57
4.1引言.................................55
4.2相关工作.................................57
4.3基于实体传播的端到端联合抽取模型................................. 59
第五章 教育本体构建中解决多关系问题的知识联合抽取.................................75
5.1引言.................................75
5.2相关工作.................................77
5.3基于形式化概念分析的联合抽取方法.................................78
......
第六章教育本体构建中知识的共指消解
6.1引言
本章节研究了知识抽取中的另外一个重要任务:共指消解。共指消解是用于自然语言处理、机器翻译、信息抽取、信息检索等领域的关键技术之一,在自然文本的实体提及连接中起着重要作用。共指消解是对指向现实世界中同一实体的不同实体提及进行聚类,例如图6.1中的功率和P,功率是P的先行词。共指消解的主要挑战是:1)首先检测文档中所有潜在的实体提及;2)识别实体提及之间文档级(句内和句间)的共指关系;3)识别共指的局部一致性和全局不一致性,如图6.1所示,实体提及对(功率, P)和(P,压强)是局部一致的,但是实体提及三元组(功率, P,压强)是全局不一致的通过对上述模型的讨论,本章节提出了一种基于神经网络的实体提及对共指消解模型。首先,设计了一个新颖的由实体提及和实体提及对构成的图。其次,利用图卷积网络(GCN)作为二元分类器来识别共指关系,因为GCN可以学习拓扑图结构的特征,也就是说可以挖掘句子间(文档级)的特征信息。由于预测结果是一种共指概率分布,因此可以综合考虑共指关系的局部一致性和全局不一致性。最后,在English Onto Notes v5.0标准数据集上评估了本章提出的实体提及对共指消解模型。实验结果表明,本章节提出的方法可以达到最优的性能,并且大大降低了时间复杂度。本章的方法在F1值上取得了最好的结果(76.0%),这比[100]等人之前发表的最佳成绩(73.8%)要好,并且具有很强的扩展性,最终将该方法应用在实际的中学物理教材中,进一步得到了验证。
6.2相关工作
与以往的流水线式方式不同,[99]和[173]提出了端到端的联合共指消解模型,该模型引入了神经网络来学习实体提及的表示,并在不使用额外句法分析器的情况下计算实体提及和先行词分数。然而,他们的模型是通过局部信息进行决策的,而不是采用实际的共指评估指标来对损失进行优化。针对上述问题,[100]引入了端到端强化学习,它直接从行为(Action)序列反馈得到的奖赏(Reward)来优化评估指标。本章节共指消解方法的思路是:首先设计一个基于实体提及的图结构,该图结构用于表示实体提及和实体提及对之间的拓扑共指关系。然后通过学习文本特征得到该图中每个节点的表示向量。整个图节点的向量可以看作是一个矩阵,该矩阵联合图节点之间的邻接矩阵,输入到GCN模型中,用于得到最终的具有拓扑特征的实体提及对特征向量。最终得到的实体提及对向量结合下游的二分类器来输出实体提及之间的共指概率,来进行共指消解任务。
标准LSTM神经元
......
第七章总结与展望
将本体应用到教育领域中可以实现多元化知识的表示、组织和互连,同时为教师和学习者提供更加智能的教育教学服务。简单来说,教育过程即对知识进行传播和管理,而本体作为一种明确化的、形式化的概念体系规范,可以充当该角色。例如,本体中的术语表(概念),可以用来表示教育领域中的广泛知识点(词汇、术语、逻辑声明、属性值等);本体中的分类体系可以用来表示知识点之间的语义关系(概念的层次化);本体中的规则体系可以用来进行知识的推理。针对共指消解中遇到的低效和全局不一致性问题,首先,提出了一个新的基于实体提及和实体提及对的图来直接对所有可能的实体提及对进行建模。然后,使用图神经网络(GCN)来学习构建的图结构,采用GCN网络的好处在于可以学习到异构的拓扑空间特征(文档级特征),并与Focal损失函数相结合构成了一个共指消解模型,用于进行共指消解任务。由于预测结果是一种共指概率分布,因此可以综合考虑共指关系的局部一致性和全局不一致性。在公共数据集Co NLL-2012 Shared Task English上的实验结果表明,我们的方法可以达到最优的性能,并且降低了时间和空间复杂度。而在实际的教育知识之间的共指案例来分析,该方法可以有效地识别知识之间的共指关系。
参考文献(略)
参考文献(略)