计算机论文哪里有?本文针对渔船 AIS 轨迹数据的特点,提出了一种基于分段余弦相似性的可疑行为检测算法。
第一章 绪论
1.2.1 “一船多码”的研究现状
每一个船舶都有唯一的 MMSI 码,用来方便准确地识别船舶,提高船舶海上遇险搜救效率。“一船多码”[17]违法行为主要包括擅自修改 MMSI 码,冒用其它船只 MMSI 码,安装两台 MMSI 码不一致的 AIS 设备。部分违法人员受利益驱使,篡改冒用 MMSI 码来逃避监管部门监管,严重影响了船舶航行的安全以及航运业的绿色发展。在船舶遇到紧急情况下,根据错误的信息,难以及时确定船舶准确的信息,影响救援效果,一些进行违法行为的船只企图利用其他船只的 MMSI 码逃避监管部门的监督。所以有效地识别出具有“一船多码”现象的船舶十分必要。现有的对于“一船多码”现象的研究是指对指定时间区域内的 AIS 轨迹数据进行人工筛选出不规范的船舶,再经过人工现场排查,找出违法行为的船舶,维护水上安全通信。
1.2.2 可疑行为识别的研究现状
向琛[18]提出了一种结合 DBSCAN 算法和孤立森林算法(Isolation Forest,iForest)的船舶可疑行为检测模型,可以检测出多种不同的可疑行为。王永明[19]针对船舶间的距离没有在安全范围内,提出数据,最终实现了对船舶领域三种入侵行为的检测。王正星等人[20]针对传统船舶异常识别算法在大雾环境下存在的缺陷,提出了基于大雾天气下船舶异常行为识别算法,了基于船舶领域的异常行为检测算法,该算法应用了统计学知识,结合了船舶AIS 轨迹该算法引入大雾天扰动特征,建立混合高斯模型(Gussian Mixture Model,GMM)与数据挖掘(Data Mining,DM)算法,完成对船舶异常行为的挖掘。杨帆等人[21]针对单向长短期记忆网络模型(Long Short-Term Mermory,LSTM)无法很好地识别出数据集的异常,提出双向的 LSTM 船舶异常行为识别算法,该算法通过对海量 AIS 轨迹数据进行标签划分,进而将数据输入到双向 LSTM 神经网络中并建立检测模型。何帆等人[22]提出基于电子海图的船舶可疑行为检测算法,该算法建立了相关的数学模型并将其应用于电子海图中,最终很好地识别出船舶的可疑行为。甄荣等人[23]为了能够识别出航行轨迹异常的船舶,利用统计学中的最小二乘法(Least Squares,LS)对船舶轨迹点进行线性拟合,得到船舶航行时的典型数学模型,并通过设定船舶经典航行距离阈值,将超出这个阈值范围的船舶认定为轨迹异常型船舶。朱飞祥等人[24]运用地理网格技术将研究的海域进行划分,对每个网格上的船舶航行行为进行分析,运用 DM 技术得出整片海域船舶行为模式,进而有效地识别出可疑船舶。
第三章 AIS 轨迹数据预处理
3.1 数据采集
第二章介绍了 AIS 包含四类基本信息,有静态信息、动态信息、与航行相关的信息、与安全相关的信息,其中与安全相关的信息在渔船领域是不需要的,渔船安装的是 B 级AIS 设备。对渔船 AIS 原始轨迹数据进行相关操作后,可以得到渔船轨迹属性信息表,如表 3-1 所示,渔船 AIS 静态信息表,如表 3-2 所示,其中部分原始轨迹数据样例,如表 3-3所示。
第五章 改进型轨迹段 DBSCAN 的可疑行为检测算法
5.1 基于改进型轨迹段 DBSCAN 检测算法的相关问题描述
5.1.1 算法思想
渔船 AIS 设备包含着渔船航行时的轨迹信息。渔船在某个区域内航行具有一定的规律性,可以通过对该区域内船舶航行的历史轨迹数据进行分析,得出船舶航行时正常轨迹序列。若新产生的一条渔船轨迹数据超出历史航行轨迹数据的范围,则认为这条新产生的渔船轨迹是一条可疑轨迹序列。可疑轨迹序列产生的原因包含多种因素,主要有自然环境(海啸和台风等)、船舶自身故障(AIS 设备失灵等)、潜在的违法行为(非法捕捞,非法运输等)。这些因素不仅会对可疑的渔船自身造成严重的损害,也会给区域内其它船舶带来隐患。所以本文针对渔船可疑行为中的轨迹异常现象,提出改进型轨迹段 DBSCAN 的可疑行为检测算法,将算法中轨迹点间的距离改进为轨迹段间的距离,将分段化的 DTW 算法与余弦距离引入到距离计算中,经过对比实验验证,该聚类算法提高了船舶轨迹聚类的准确性,具有一定的实用性价值。本章首先对基于改进型轨迹段 DBSCAN 算法的相关问题进行了描述,然后对基于改进型轨迹段 DBSACAN 检测算法进行了概述,其次对基于改进型轨迹段 DBSCAN 的检测算法进行了实验,最后对该章内容进行了总结。
在对渔船轨迹进行分段之后,需要对分段之后的渔船进行相似性度量,进而为轨迹聚类做准备。改进型轨迹段 DBSCAN 的可疑行为检测算法输入的是渔船轨迹段,输出的是不同种类的轨迹段,每一个种类轨迹段代表渔船航行的一种运动模式,轨迹聚类解决的是轨迹段之间的差异性。
5.1.2 轨迹段相似性度量
针对 2.3.2 节中提到的使用改进的 DTW 距离算法精度不够高且对距离较为敏感的问题。使用 Frechet 距离作为轨迹相似度度量对噪声数据较为敏感且时间复杂化度高。
5.2 基于改进型轨迹段 DBSCAN 检测算法的描述
步骤一:任意选择一条渔船航行的历史轨迹作为核心轨迹。
步骤二:以该核心渔船轨迹为起始点,根据 DBSCAN 聚类算法预先设定好参数 ε 以及minPts 找到原始渔船轨迹中的所有核心轨迹,其中 ε 值为预先设定好的距离值,该距离值为 5.1.2 节所述的综合距离值,minPts 表示的是密度阈值,即包含多少条轨迹数据。
步骤三:以任意一条核心轨迹为起始点获取到与其密度可达的由渔船轨迹组成的轨迹簇,直到所有的核心轨迹均被访问到。算法流程图,如图 5-2 所示。
第六章 总结与展望
6.2 展望
随着人们对海洋领域研究的深入以及海上交通安全的关注,渔船可疑行为也逐渐被国内外研究者重视。对渔船航行轨迹的可疑行为研究方面还存在诸多有待改进的方面:
(1)本文对渔船轨迹的相似性度量的研究只考虑了渔船轨迹的经度、纬度、时间因素,并没有考虑到航速,渔船大小等因素,未来将结合这些点进行深入研究,渔船轨迹数据的挖掘也将会是我今后研究的主要方向之一。
(2)基于密度的聚类算法是一种应用十分广泛的数据挖掘算法,在海上交通监管领域得到广泛的应用,目前已经在船舶航行模式以及海上交通模式分析等领域进行了一定研究。未来应深入研究密度聚类在相关领域中的应用,并通过改进聚类算法的方式,构建更适合的模型,为海上交通监管提供强有力的支撑。
由于本人知识储备能力以及科研能力的限制,在这次论文研究工作中还存在着诸多不足以及需要提高改善的地方,也存在一些不够合理以及不够严谨的地方,在未来我会更加努力学习,弥补不足。
参考文献(略)