本文是一篇计算机论文,计算机应用技术专业培养具备管理学理论基础、计算机科学技术知识及应用能力,掌握信息管理、信息系统分析与设计方法等方面的知识与能力,能在各类企、事业单位、金融机构及政府部门从事信息采集、组织、分析、传播和服务等信息管理工作或与信息管理工作相关的信息系统规划、分析、设计、实施、运行管理和评价等方面的应用型人才。(以上内容来自百度百科)今天为大家推荐一篇计算机论文,供大家参考。
第 1 章 绪论
本章介绍了信息物理系统 (Cyber Physical System, CPS)的概念、体系结构以及特点,分析了与计算机网络、嵌入式系统的关联,并描述了可以通过主动式复杂事件处理技术来解决 CPS 数据处理这一关键问题,以及当前相关技术的研究进展与面临的各种挑战。在此基础上,本章对论文的主要研究工作内容进行了详细描述,并对介绍了本文的组织结构。
1.1 研究背景及意义
在传统科学观念中,物理和信息世界是涉及两个不同领域知识的世界,因此在实际生活中信息系统的基础建设和物理系统的基础建设是两个独立的过程。随着计算机技术、通信与控制技术的发展,物理世界与信息系统集成的速度越来越快,人类面临的物理世界正朝着网络化、信息化的方向发展,物理世界和信息世界的交互融合将是未来科技发展的趋势[1]。在此背景下,促进了CPS这一概念的提出,同时也使得CPS成为近年来科技研究的热点。CPS作为物理进程和计算进程的有机结合体,是集成控制技术、计算技术和通信技术于一身的智能系统。在CPS中系统与物理进程的交互主要通过人机接口实现,通过网络传输的方式,可以实现对某个物理实体,进行远程、实时、安全、可靠的操作。目前CPS已经对国家各个领域的发展有着巨大的影响作用,应用领域也越来越广泛,比如国防[1]、医疗[3]、航空航天[3]等多个领域。目前已经进入移动互联网时代,人与物理世界之间的交互终将因CPS技术而改变[4]。在CPS中,以传统的嵌入式实时系统作为基础,主要采用控制技术、无线传感技术、网络传输技术、信息处理技术等,将物理系统和信息系统有机融合,构成复杂的网络分布式实时系统。如图1.1所示,CPS的体系架构通常由四个层次构成,分别是[4]:(1)感知层:主要采用控制器、传感器、采集器等作为感知设备,主要负责收集物理世界的特定属性。比如收集交通系统中的车流量、速度特征参数,或者具体场景中的光照强度、温度、湿度等参数。(2)网络层:包括GPS和Internet等通讯方式及相应的网络设备,将虚拟的信息世界与现实的物理世界连接在一起,承担着不同组件间数据交换的工作。网络层为CPS提供实时的网络服务,为所有组件提供无缝连接。
.......
1.2 相关研究进展
研究人员已经对复杂事件处理做了相当多的研究。目前比较成熟的 CEP 系统有 SASE[13]、Cayuga[14]、T-Rex[15]和 ZStream[16]等。这些系统在很多项目中都有应用,然而它们的研究大多集中在事件处理语言表达、性能等方面,忽略了事件处理方法的优化和改进。分布式和并行 CEP 的体系结构与算法是当前研究的一个重点。在过去的研究工作中大部分研究者采用的体系结构为集中式,随着数据量的急剧增加,对集中式体系结构的计算能力、带宽等有着更高的要求,同时由于传输网络自带的问题,如网络拥塞、结点故障等情况,加剧了该结构的不稳定性,同时使得其可扩展性降低。前文提到 CPS 的特点之一就是分布性,如果采用集中的处理方式,不能应对实际应用的分布式情况。因此许多研究人员进行分布式复杂事件处理的研究。在文献[17]中,Schultz-M ller 等人所采用的分布式复杂处理方法中,引入了查询重写的技术。Dwarakanath 等在分布式环境中提出一种基于用户间交互通信的信任管理模型 TrustCEP 来进行 CEP 操作[18]。Wilson 等提出了一个基于有向无环图(DAG)的查询模型,并且引入了一个被称为事件集的新型抽象仿真算法[19]。Flouris 等给出了 FERARI 模型,一种能够在分布式拓扑中实现大量事件数据流的实时复杂事件处理的原型[20]。综上所述,在 CEP 的研究上,主要是针对大型和分布式系统事件模型和算法性能的研究。由于传感器自身存在数据误差、网络传输过程中的数据丢失、计算模型和控制部件的误差等因素,使得 CPS 的事件带有不确定性,因此针对具有不确定性数据的复杂事件处理研究备受关注。通常数据的不确定性采用概率来表示,通过动态贝叶斯网络、隐马尔科夫模型和条件随机场等模型进行概率性原始数据的 CEP。有些学者也采用有限状态机模型进行概率复杂事件的处理。针对采用 NFA 模型的复杂事件处理,Hideyuki 等提出了一种优化方法,使得 NFA 可以对复杂事件的概率进行计算,同时还可以计算出复杂事件模型的可信度。在该研究领域中由美国华盛顿大学设计实现的 Cascadia 系统[23]和 Laha 系统[24]是具有概率 CEP 特征的典型代表。其中 Cascadia 系统采用可能世界模型,使其可以对历史概率事件和概率事件流进行查询,但其在预处理中并未考虑事件流中,相邻事件之间的相关性。Laha 在此基础上进一步发展,可以高效查询概率事件流中的关联性。同时 Laha在 CEP 中引入了代数操作,因此该系统对复杂事件的处理更加灵活。Gerea 等人采用准确的时间戳对无序事件流进行处理,形成按输入事件时间排列的有序偏序[25]。在概率性数据库中主要研究值得概率性,并未涉及时间戳概率的研究。因此很多研究者从事时间戳乱序问题的研究。Liu M 等人利用自动机进行建模,在跃迁判断的谓词中增加时序乱序的判定谓词,将因乱序而匹配得出的错误复杂事件过滤掉。但其提出的方法并未对这种乱序进行修改,因此其仅能对部分的乱序事件进行处理[27]。Kawashima H 等人利用时间间隔来进行事件处理,持续时间用时间间隔来表示,但在系统对事件进行处理时,要求事件按照严格的偏序或者准确的时间戳,因此该方法并不能有效的进行 CEP[28]。Flouris 等人对基于大数据背景下的复杂事件处理方法进行了对比,对未来的研究方向进行了探讨,但并未给出具体方法[21]。总的情况来看,学者仅限于采用信息的融合和推理来进行不确定性事件的研究,并未对复杂事件中的不确定性进行研究。
........
第 2 章 理论和技术基础
在CPS中采用主动式CEP技术进行数据的处理是一种非常高效的技术手段。本章将详细介绍主动式CEP技术的相关定义、理论和技术。本章首先对CEP技术的定义和理论进行了描述,包括事件和CEP相关模型,SASE框架。然后对事件上下文处理的相关聚类技术进行了介绍。接下来还对主动式CEP中预测分析和决策方法所采用的贝叶斯网络、马尔科夫决策过程和Q-learning算法做了描述。本章最后针对CPS应用的特点提出了主动式CEP的系统架构,本章后续工作都在此架构上进行。
2.1 复杂事件处理技术
本小节对 CEP 中的事件模型、处理模型进行了介绍,其中对目前应用较为广泛的 SASE 系统的工作方式做了描述。在事件处理中,输入的信号在控制器中经过处理和运算,依据预先设定的规则产生相应的输出,实现对系统的控制。在自动控制理论所设计的系统中,系统的输入信号和输出信号基本为模拟信号,每个系统的设计都需要单独进行,因此具有较强的专用性。随着计算机技术的飞速发展,特别是CPS的应用,物理世界的信息被数字化,设备的控制单元由传统的机械控制转换为计算机控制,如输入的模拟信号,转化为多种多样的数据。但物理信号所感知的客观世界信息多种多样,因此这些数据具有异构和非结构化的特征。对这些数据的处理技术的需求,使得事件处理技术得以诞生。事件的概念在信息领域和物理领域中很多方面己经被探索过了。然而己有的基于事件的设计方法不能直接用在CPS上。如数据库中以数据为中心的事件模型和分布式应用中以时间为中心的事件模型,因为传统的系统设计对时空是用连续的眼光,事件模型通常只涉及到一个单独的实体。
.........
2.2 事件上下文聚类技术
事件的上下文对主动式复杂事件处理非常重要,本文以模糊 C 均值(fuzzy c-means algorithm, FCM)[99]算法为基础,对事件的上下文进行聚类处理,为后面的预测分析工作奠定基础。FCM 算法是采用模糊划分的聚类算法。聚类算法的主要思想为同一个类别中元素之间的相似度最大,而不同类别的元素之间相似度最小。FCM 算法是在普通C 均值算法基础上的改进,FCM 算法与普通 C 均值算法的不同在于,其对数据的划分不是硬性的,是一种模糊的柔性划分。其模糊的特点使得其聚类结果可以对样本类别的描述是不确定的,更符合客观世界的真实情况,因此其已经成为聚类分析中的主要算法。隶属度为 FCM 算法中的一个重要概念。在集合中为了表示对象 x 与集合 A的隶属程度,提出了隶属度函数的概念,通常用符号 μA(x)表示,其中 x 为属于集合 A 的所有对象,其取值为 μA(x)∈[0,1]。当 μA(x)的取值为 1 时,则表示 x 完全隶属于集合 A,取 0 则表示 x 与集合 A 无关。该集合 A 即为一个模糊集合,在模糊集合中,元素的隶属关系就不再是硬性的非此即彼的关系。将该思想应用到聚类问题中,聚类生成的每个簇为一个模糊集合。那么簇中每个样本点的隶属度的取值为 0 到 1 之间的任意值。FCM 算法具有两个重要参数 C 和 m,其中 C 表示聚类数目,m 表示控制算法的加权指数。C 的取值必须大于 1,并且需元小于聚类样本数,m 的值如果太大,那么聚类的效果会不理想,m 的值如果太小,则 FCM 算法的效果与 HCM 算法接近。FCM 算法的输出结构为一个采用模糊划分的 C*N 矩阵和就具有 C 个聚类中心点的向量。该矩阵为每个类中样本点的隶属度。每个样本点按照最大隶属原则,根据划分矩阵进行归类。聚类中心点具有该类型的平均特征,是该类型的特征点。FCM 算法将 m 个向量 xi(i=1,2,…,m)分为 c 个模糊组,按照价值函数最小的原则,求出每个模糊组的聚类中心点,FCM 算法和 HCM 算法的最大不同在于FCM 采用模糊均值进行聚类划分,每个样本点隶属度的取值属于 0,1 之间,确定其与各组别的隶属程度。因采用了模糊划分的思想,隶属矩阵 U 的取值可以为 0到 1 之间的任意值,而不是仅取值为 0 或者 1。#p#分页标题#e#
.........
第 3 章 面向不确定性事件流的并行处理方法....32
3.1 本章引言...........32
3.2 查询语言与事件概率模型 ....33
3.3 不确定性事件流的处理方法 ..........34
3.4 实验分析...........40
3.4.1 实验数据源 ......41
3.4.2 实验结果及分析.........42
3.5 本章小结...........46
第 4 章 事件上下文处理方法...........47
4.1 本章引言...........47
4.2 基于模糊本体的事件上下文建模 ............47
4.3 事件上下文聚类方法............51
4.4 实验及结果分析 .........55
4.4.1 数据描述 ...........55
4.4.2 实验结果与分析..........55
4.5 本章小结...........58
第 5 章 主动式复杂事件处理中的预测方法........59
5.1 本章引言...........59
5.2 基于适应性贝叶斯网络的预测方法 ........60
5.3 实验及结果分析 .........65
5.4 本章小结...........70
第 6 章 主动式复杂事件处理决策方法
主动式系统的研究已经持续了多年,这些研究总体上代表了一种由响应式系统向主动式系统转变的潮流。在复杂事件处理这个领域,对主动式决策方法的研究还比较少。但当前 CPS 的发展已经对这种研究提出了需求。本章提出基于结点状态划分的并行马尔科夫决策过程(Parallel Markov Decision Process,PMDP)和基于子问题状态划分的并行 Q-learning(Parallel Q-learning,PQ)决策方法,根据上一章的预测结果,最终产生相应的决策。
6.1 本章引言
MDP 作为一个最佳决策过程中的随机动态系统,多年来人们已对其进行了深入的研究,并在多个领域中得到了广泛的应用。但目前很少有文献涉及如何将MDP 融入到主动式复杂事件处理中当。当应用到 CPS 的事件处理领域,MDP 的规模更大且具备一些新的特征,其具体模型和巨大的状态空间造成的组合爆炸问题仍然是一个挑战。针对上述问题和复杂事件处理过程的特点,本章在之前的预测结果上,提出PMDP 来支持主动式的复杂事件处理决策。针对 CPS 中 MDP 存在的状态数量巨大的问题,引入基于结点的状态划分和报酬分解方法来进行并行优化。在此基础上,当面向更大规模的数据时,提出了一种基于子问题状态划分的 PQ 决策方法来提高系统的性能。以交通 CPS 为背景的实验中表明,本章所提出的方法针对结点拥塞问题能够做出有效的决策。本章对所研究问题的主要贡献如下:提出一种基于结点的状态划分的 PMDP 决策方法。该方法可根据预测结果做出相应的决策,从而改变系统的状态。提出一种基于子问题状态划分的 PQ 决策方法。该方法在面向大规模数据时有更好的表现。通过实验比较了 PMDP 方法与 PQ 的决策结果。本章余下部分组织结构如下:在 6.2 节主要描述了 PMDP 决策模型的原理以及基于结点的状态划分过程。在 6.3 节中介绍了 PQ 决策模型以及基于子问题的状态划分过程。在 6.4 节中对本章提出的方法进行实验对比并进行相应的分析。最后在 6.5 节中对本章的工作进行了总结。
.........
结论
信息物理系统(CPS)作为近年来的热点研究领域,越来越受到人们的关注。CPS 通过计算机、通信和控制技术,将计算资源与物理资源紧密的融合并协同工作,在跨平台的复杂环境中实现数据的交互和控制操作的反馈。CPS 应用需要面对的一个重要问题就是如何处理系统中持续产生的海量、异构和不确定性的数据。本文采用了主动式复杂事件处理技术来解决上述问题。该技术首先按照既定规则对 CPS 中各种传感设备产生的原始信号进行处理,在得到高层次的复杂事件后还能进一步对其进行预测分析,为系统提供影响或改变未来状态的决策。本文将针对 CPS 中主动式复杂事件处理面临的关键问题进行研究,从不确定性复杂事件处理的问题出发,进而对事件上下文处理、主动式处理中的预测方法和决策方法进行研究。在对国内外最新的研究和进展上做了充分的了解和研究之后,继而提出本文的研究内容与创新点。具体可分为以下几个方面:
(1)针对不确定性数据处理问题,提出了一种并行复杂事件处理方法 PISCEP。在 CPS 的实际应用中,由于传感器噪声等因素,数据存在不确定性的情况非常普遍。因此,很有必要专门针对不确定性数据进行处理。本文在引入不确定性事件概率计算的基础上,通过匹配树与缓存表相结合的方法实现对原始事件流的高速处理,还特别针对复杂事件处理中最重要的顺序事件(SEQ)做了并行优化。从实验结果中可以看出,PISCEP 方法能够有效的处理不确定性事件流,有极大的可用性。
(2)针对 CPS 数据流中普遍存在上下文的情况,提出了一种事件上下文处理方法 ECPM。事件的上下文种类繁多,将其聚类后分别处理具有十分重要的意义。传统的模糊 C 均值算法要求先确定聚类中心,如何选取聚类中心是算法的关键。针对上述问题,本文采用模糊本体对事件上下文进行建模,然后通过改进的模糊 C 均值算法实现事件上下文的数据聚类,为后面的预测模型提供学习和预测的依据。实验结果证明了 ECPM 的处理结果具有较高的准确率。
(3)针对单一的预测模型无法适应多种环境的问题,提出了一种基于适应性贝叶斯网络的上下文敏感复杂事件预测方法 CPMCE。在事件上下文聚类的基础上,CPMCE 可根据不同的事件上下文学习对应的贝叶斯网络模型结构,在预测分析时能够根据事件上下文匹配一个或多个模型。该方法基于一种混合型的增强学习方法实现贝叶斯网络的结构,并通过高斯混合模型来做出近似推断。实验结果显示,CPMCE 方法在模拟数据和真实数据上的预测准确率均优于贝叶斯网络和深度信念网络。
..........
参考文献(略)