计算机学术论文哪里有?本文在总结目前各种网络重构算法的基础上,着重研究基于多元时间序列的网络重构算法,并提出了基于斯皮尔曼相关系数的网络重构方法。本文通过考虑复杂系统运行时可能存在异常运行情况,因此将复杂系统分为正常运行状态与异常运行状态两种情况进行分析。本文首先通过提出的异常检测算法将采集到的多元时间序列数据进行分类后,再使用网络重构算法分别对正常与异常两种状态进行网络拓扑结构预测,最后将两种网络汇总为完整的复杂网络。
第 1 章 绪论
1.2 国内外主要研究现状
由于本文需要将复杂系统分为正常运行与异常运行两种状态来进行分析,因此本文会涉及异常检测技术,所以本节共由复杂网络重构与时间序列异常检测两部分综述组成。
1.2.1 复杂网络重构
目前复杂网络重构的常用方法为相关性分析,压缩感知,动力学方程,因果分析以及基于深度学习的方法等。近年来这些方法被广泛应用于各个领域的复杂网络模型重构的研究,下文将对学术界网络重构领域的主流方法和研究现状进行简单介绍。
首先是基于相关性分析的网络重构方法。相关性分析,是深度学习以及机器学习领域常用的数据处理方法。其在网络重构领域也占有一席之地,例如在生物学领域,文献[12,13]针对基因表达数据,通过详细的实验对多种相似性方法重构基因调控网络的有效性进行了校验。在以往的研究中,相关系数与互信息是相关性分析常用的两种评价指标。对于相关系数,常见的有皮尔逊相关系数(Pearson)、斯皮尔曼相关系数(Spearman)、肯德尔相关系数(Kendall)等。根据相关系数进行网络重构的方法主要包含以下几种,文献[14]使用改进的相关系数分析了基因之间的相关系,以此来重构基因调控网络。结合细胞代谢数据,文献[15,16]使用相关性分析重构了细胞代谢网络。在最近的研究中,文献[11]提出了一种结合频域分析与斯皮尔曼相关系数的多元时间序列复杂网络重构方法,并在金融数据集与火力发电场景下锅炉数据集上进行了校验。文献[17]提出了局部约束正则相关性分析的方法,并使用该方法重构了大脑连接网络。而互信息则是信息论的基础概念,其在复杂网络重构领域亦有相当广泛的应用。例如PCA-CMI算法使用条件互信息重构基因调控网络[18,19,20]。文献[21]通过将Hill-Climbing方法引入PCA-CMI算法对其进行了改进,提高了算法的重构精度。文献[22]提出了CLR算法,通过使用变量之间的互信息经验分布评分来评价变量之间的相关性。文献[23]将递归优化算法与互信息相结合,利用基于机器学习的算法来衡量变量之间的相关性。文献[24]将最大信息系数(MIC)引入到网络重构领域,并成功重构了脑功能网络。众所周知,相较于传统方法,并行计算可以极大的提高计算速度,在此基础上文献[25,26]提出的MIC框架通过利用并行计算的相关特性,极大的提高了MIC算法的时间效率。相比于其他网络重构算法,相关性分析具有原理简单、计算速度快等优点,其非常适合实际应用场景。
计算机学术论文范文
....................................
第 3 章 基于特征丰富与时间卷积网络的异常检测框架
3.1 引言
近年来使用数据驱动的方法来解决异常检测问题变得越来越流行,许多基于机器学习以及深度学习的模型被开发出来用于提高多元时间序列异常值检测的准确率。与传统的检测方式相比,机器学习的方法具有很好的自适应能力。仅通过大数据进行驱动,此类模型就可以完成自我训练,其在许多领域中已被证明可以很好的提高时间序列离群点检测的准确率。对于多元时间序列异常值检测的研究一般分为半监督学习方法,无监督学习方法两大类。在半监督学习方法的研究中,研究者一般采用统计判别算法和无监督算法作为模型的第一层,把有监督算法作为模型的第二层,以此来形成一个无监督与有监督相互结合的框架[68-71]。但是这种方法往往存在一个天然的缺陷,即我们需要一定数据量的标注好的异常数据。其次是无监督学习的方法,近几年随着硬件技术的不断发展,深度学习模型在时间序列分析领域得到了广泛的应用,其中以 LSTM 和 GRU 为代表的循环神经网络 RNN 所构建的模型更是被认为非常适合时间序列分析处理。相比于传统模型以及机器学习模型,基于深度学习的无监督检测算法往往具有更高的检测精度[72-77]。但是上述技术在进行数据处理时往往是简单的将数据分割成块,作为单独的向量输入模型,这往往会损失数据之间的相关性。
因此本章考虑了基于多元时间序列的异常检测中数据的时间相关性问题,将范数,范数差引入到滑动窗口技术,使用范数来捕捉时间窗内数据之间的时间相关性,范数差来捕两个时间窗口之间的相关性。随后本章利用基于统计学的时间序列特征提取方法,选择了均值(MEA)、最大/最小值(MAX/MIN)、25%,50%,75%三种四分位数(25Q,50Q,75Q)、标准差(STD)、峰峰值(P2P)8 个统计特征,将原始时间序列进行特征丰富,得到了特征丰富的时间序列,并以此来提高检测的精度。最后本章结合深度学习中具有更好的记忆能力的时间卷积网络[81]和自动编码器技术,提出了基于时间卷积网络的自动编码器(TCN-AE)以此作为本章提出的异常检测框架(MOTCN-AE)的核心组件。通过使用网上公开的真实数据集(UAH-DriveSet[88],NAB[89])对模型进行校验,展示了我们算法的精确度和鲁棒性。
.................................
第 5 章 完整网络模型构建及数据高效存储
5.1 引言
通过查阅相关资料可知,现实社会中存在的复杂系统可以分为正常运行与异常运行两种状态,而目前现有的各种网络重构算法大多未考虑过将复杂系统运行状态进行分类的情况。因此本文在提出网络重构算法的基础上,率先将异常检测算法引入到复杂网络重构算法模型框架中。首先根据本文第三章提出的时间序列异常检测算法,通过对系统运行产生的时序数据进行分析挖掘,将复杂系统分为正常运行状态与异常运行状态两种情况。之后本文再使用第四章提出的网络重构算法分别对两种状态的数据进行网络拓扑结构预测,并得到了复杂系统正常运行下的网络结构,以及异常运行下的网络结构。最后本章将两种网络汇总为完整的复杂网络模型,具体流程如 5-1 所示。根据以上流程,在本章第二节本文通过对汽车行驶数据集中 GPS 车速(GPS)、发动机转速(RPM)、扭矩百分比(Torque)、油门踏板开度(Gas)、发动机负荷百分比(Eng-Load)、进气流量(In-Flow)六个传感器产生的时间序列数据进行分析挖掘,我们成功获得了汽车传感器网络模型。
进一步本章也研究了网络模型的存储问题。在以往复杂网络的研究中,研究人员大多关注于对未知网络进行重构或者根据已有网络拓扑结构进行分析挖掘,而对于网络模型的存储,则没有一个统一的标准。对于常规数据的存储,业界最受欢迎的是以 Oracle,MySQL 为代表的关系型数据库,此类数据库将数据存储为多张相互关联的二维表,通过主外键关联的形式获取数据之间的联系。但是该类数据库存储的数据往往是静态的,其业务灵活性较差。因此以 Oracle 为代表的关系型数据库或者传统的数据仓库并不适合图数据的存储。随着软硬件技术的不断发展,非关系型数据库中的图数据库逐渐进入人们的视线。图数据库采用图论作为基础设计理论,将数据命名为实体、关系、属性三种类型,通过图的形式来存储强关联关系的数据[97]。相较于关系型数据的数据静态特点,图数据库可扩展性高可以很容易的根据业务变更对数据进行更新,这使得图数据库在新增节点或者关系的同时不会影响现有的业务逻辑。
..........................
5.2 完整网络模型重构
本节我们将结合第三章提出的 MOTCN-AE 算法与第四章提出的 SCRN 算法,分别对复杂系统正常运行状态与异常运行状态两种情况进行建模,最终生成的网络模型将尝试使用 Neo4j 数据库进行存储。
本次实验同样使用了汽车行驶数据集,共选用 GPS 车速(GPS)、发动机转速(RPM)、扭矩百分比(Torque)、油门踏板开度(Gas)、发动机负荷百分比(Eng-Load)、进气流量(In-Flow)六个传感器作为网络结点。根据表 5-1 传感器生成的时间序列数据,本文对汽车正常行驶与异常行驶两种情况分别重构了复杂网络模型。如图 5-2 所示,左侧图为正常行驶状态下重构的网络模型,右侧为异常行驶状态下重构的网络模型,数值大小表示传感器之间的关联程度,红色表示 x 轴对应的传感器影响 y 轴对应的传感器,蓝色表示 y 轴对应的传感器影响 x 轴对应的传感器。由图中可以看出,除 GPS 车速与油门踏板开度不同外,两种状态下重构的复杂网络模型基本相同。以 GPS 车速为例,其主要影响发动机进气流量、油门踏板开度、发动机转速,根据常识可知该结果也较为合理。
图 5-2 正常行驶状态下重构网络参数(左),异常行驶状态下重构网络参数(右)
...............................
第 6 章 总结与展望
6.2 研究展望
随着相关研究人员对复杂网络领域的不断深入研究,学术界以及工业界产出了非常多推动社会进步的重大成果。但学术研究是永无止境的,人们对复杂系统以及复杂网络的研究将会不断进行。本文主要研究了多元时间序列复杂网络重构问题,虽然在该方向上取得了一定的成果,但是该问题还有很多方面都有待研究。为了方便后续工作的继续进行,本文对多元时序数据复杂网络重构领域可能存在的问题做了进一步的探讨:
首先是无法测量节点的存在,此种情况在大规模网络中尤为常见。由于这些节点的存在,必然对网络重构产生一定的影响,如果再考虑外部扰动对输入信号的影响,那么将会进一步增加网络重构的难度。理想情况下,我们可以抽取部分节点来代表整个网络,但这在真实情况中往往很难实现。因此研究相应的算法来消除隐藏节点以及外部扰动的影响也成为了复杂网络重构需要解决的一个问题。
其次,对于带噪声的时间序列数据,例如数据带有高斯白噪声,或者部分带有噪声等,我们采用的是小波降噪的方式来对噪声进行过滤。但是小波降噪也不是完全适用于各种噪声的,其往往也需要根据噪声的类型对算法进行一定的改进,所以一种行之有效降噪算法也是网络重构成功的关键。
再者,针对数据缺失问题,本文对缺失数据采取的是直接删除的方法。该方法虽然执行效率很高,但略显粗暴,在模型精度要求较高的领域往往会影响网络重构的结果。因此插值算法与网络重构算法的结合也成为了网络重构领域所需要解决的问题之一。 然后,在当下人工智能以及深度学习技术不断取得新突破的大环境中,诸如神经网络推断 NRI 算法、Gumbel 图网络模型等算法的提出,深度学习技术开始在网络重构领域崭露头角。鉴于其在图像、NLP 等领域取得的成果,研究如何使用相关技术通过纯数据驱动的方式来重构复杂网络也成为复杂网络重构领域研究的一个重点。
最后,由于时间原因,本文在第五章第四节探讨分析的时间序列数据库暂未进行实验,而且本文提出的理论和方法仅仅是在小规模网络上进行了尝试与应用(第五章的实验本文只选取了六个传感器)。由于真实数据集获取比较困难,且工业领域对数据隐私保护要求较高,因此在以后的研究工作中,争取与相应领域取得合作,以使用真实的大规模数据集来对网络进行重构。
参考文献(略)