上海论文网提供毕业论文和发表论文,专业服务20年。

基于机器学习的武警警务数据之计算机研究

  • 论文价格:免费
  • 用途: ---
  • 作者:上海论文网
  • 点击次数:101
  • 论文字数:0
  • 论文编号:el2019111922235619463
  • 日期:2019-11-07
  • 来源:上海论文网
TAGS:

第一章 绪论

1.1 课题的研究背景与意义
随着实现中华民族伟大复兴中国梦的伟大工程不断推进,部队发展建设越来越受到党和国家领导人以及社会各界人士的重视[1]。一百多年前,中华民族所遭受的那一场深重的灾难和一幕幕屈辱的历史还依稀可见,中华民族要想屹立于世界民族之林,不仅要在经济上有大的发展和飞越[2],综合国力也要稳步提升,而强大的军队将是经济腾飞和综合国力跃升的有力支撑[3],习主席在十八大、十九大报告中都提出了改革强军的战略设想,通过这些年对中国的军事力量和组成结构地改革重构,人民解放军已经插上强军的翅膀,实现了脱胎换骨的变化[4]。
随着部队改革的推进和自身岗位的变化,作者感受到部队每天所产生的数据越来越多,比如人员信息、训练数据、身高体重数据,还有我们武警相关的集访数据、群体性事件数据、反恐怖数据、个人极端事件数据、劫持人质事件数据、有组织犯罪数据等等[5]。这些每天都在生成的数据无疑是一座有价值的宝库,然而,由于这些数据比较零散,而且统计的方式比较粗放、多样化,涉及部门也比较多,所以利用起来比较困难,长期处于废弃状态。
武警部队官兵每天都在进行常态化的执勤处突,反恐维稳,抢险救援,海上维权等任务[6],所以武警官兵每天都处在敌对势力和犯罪团伙压力之下,目前,敌对势力和犯罪团伙压力的联络方式和破坏手段越来越便捷和隐蔽[7]。例如恐怖分子的袭击、贩卖毒品、暴力攻击、非法走私和军火交易等[8]。这些犯罪团伙通过网络来秘密筹划犯罪活动,散播谣言,制造恐怖舆论[9]。传统的犯罪活动,由于获取消息的延时性和封闭性,为公安机关的破案带来了极大的困难,也导致武警人员不能行之有效地进行预防和抓捕[10]。而如今网络在各行各业都得到了快速的发展[11],这为犯罪分子的活动提供了巨大空间的同时,也为武警获取犯罪分子的情报提供了数据来源[12]。在大数据时代下,要是能够对这些数据进行合理地分析,就会进一步掌握犯罪分子在网上进行活动的主要特点,就可以提前对这些犯罪活动进行有效的防控[13]。通过把有效的数据进行挖掘,就会更进一步的获取犯罪分子的逃跑路线,这样不仅可以提前布控[14],实行有效的逮捕,也能节省大量的财力物力,使得维稳行动变得更加便利[15]。
.........................

1.2 国内外研究现状
随着信息采集技术的蓬勃发展和数据处理技术的提升,大数据越来越表现出惊人的优势,美国一些选举机构利用舆情分析成功预测总统大选结果,还能预测大部分参议员和众议员的选举结果;超市利用顾客的购买行为数据,高效的设置超市物品摆放策略,从而刺激顾客的消费欲望和增加购买行为,提升利润空间[29];GOOGLE 利用互联网上抓取的动态数据,成功预测了甲型 H1N1 病毒爆发的地域分布图,比传统卫生部门要快 2-3 周;一家名为 Farecast 的科技公司为了帮助消费者抓住最佳购买时机,对机票价格的走势以及增降幅度进行预测[20],而在此之前还没有其他网站能让消费者获得这些信息。上述这些都是大数据在思维变革、商业模式变革等各个场景的应用,由于保密,信息集采方法粗放单一,部门之间协调不畅等原因,武警警务数据一直是学术研究的空白领域[21],当然,武警警务数据和公安警务数据有诸多相似的地方,比如一些恶性案件数据、反恐维稳数据等方面数据模式基本相同[22];同时武警警务数据又有其独有的一些数据,比如各类训练数据、现役军人身高体重数据、抢险救援数据等等,所以这要求我在借鉴公安警务数据研究的基础上推陈出新,专注于服务部队战斗力提升这个根本落脚点用力[23]。
1.2.1 国内研究现状
近些年以来,全国各地公安机关也在不断地探索大数据服务于实战的应用。从 2012 年开始,苏州市公安局从美国引进了犯罪预测系统,先在市范围内进行犯罪预测实验[24]。各地政府也紧随时代潮流,在民意调查,社会管理,铁路运输、民生服务、农林牧业等方面开展各种预测方法[25]。2007 年,中国人民公安大学教授梅建明,做了一些反恐数据的挖掘工作。目前,钦州市公安局应用大数据技术对 DNA 信息进行关联分析,取得了初步成效。虽然各种大数据预测方法层出不穷,但在实际应用中仍没有高效将全部赢无数据用于服务实战[26],各级公安机关中的数据信息仍处于摸索尝试阶段。武警警务大数据也面对着和公安警务大数据同样的一些问题,有些甚至比公安警务大数据更加棘手,有很多国内顶尖的大数据相关学者很少将精力放到研究武警警务大数据上[27],一是由于保密因素,武警警务数据都是密级数据,不能在互联网上公开,更别说合理利用了;二是武警部队对武警警务数据的研究分析还不够重视,没有调集人员将基础的信息集采工作流程理顺,导致很多数据都需要手工录入和人工处理,这也是武警警务数据一直未被开发利用的重要原因;三是武警警务数据没有统一的管理系统,且数据分布散乱,造成了大数据技术的部队人员无法接触到武警警务大数据,能接触到武警警务大数据的部队人员大部分又缺乏相关的工程技术能力[28]。
......................

第二章 数据处理

2.1 武警警务数据来源
本文主要是对武警警务数据进行分析,原始数据有的是从湖南省各大警务信息系统中授权获得,有的是在武警湖南总队担负各类任务的基层单位收集得到。如个人极端事件的数据是从担负省委省政府、市委市政府警卫勤务的武警中队和地方公安机关获取;群体性事件的数据是从长沙支队执勤十二中队、省委省政府执勤中队、长沙支队执勤十五中队等单位获取;恶性暴力事件数据是从湖南省部分县、市两级看守所获取。本文只从中选取了文本和表格数据,并把这些收集到的数据制成 Excel 表格。武警警务数据数据类型繁多,数据结构复杂,数据种类多样,但是经过数据的清洗和归一化,根据这些数据预测未来一段时间内,某个城市发生犯罪事件的概率是可行的,本实验选取的武警警务数据中的事件总体上可分为三类:杀人事件、集体事件和集访事件(数据都是经过严格脱密的数据,不涉及任何敏感信息),该数据集中记录了从 2008 年到 2018 年近 10 年间,湖南省各个城市(长沙、株洲、湘潭、邵阳、岳阳、常德、益阳、娄底、怀化、张家界等)的治安案件和群体性事件数据 325440 条,其中包括时间、地点、事件描述、人群规模、警力人数、持续时间、警力编成、案件人姓名、案件人职业、案件人民族、案件人特长、案件人年龄、案件人文化程度、案件人面貌、案件人籍贯、案件人单位、案件人罪名、案件人刑期和案件人前科这 19 列属性值,下面列出部分原始数据的截图,原始数据如表 2-1 所示。

........................

2.2 武警警务数据预处理
如前文所述,实际工作中获取到的原始数据并不规范统一,常常伴随着缺失值、重复值、单一值等情况。这些数据不能直接使用,需要对原始数据进行预处理[23]。数据预处理没有具体的标准,由于数据的属性和类型不同而采用不同的处理方法。数据预处理的常用流程为:去除唯一属性、处理缺失值、属性编码、数据标准化正则化、主成分分析。
在数据处理之前,一般要先对数据进行整体分析,对影响分析结果的属性进行预选取。首先选取的属性意思明确,数值唯一不存在二义性;接着可以选择那些存在多个数值但是含义明确的数据以及可能与预测结果有所关联的字段。对原始数据初步选取后,需要进行下一步的操作,包括填充或删除数据中的缺失值,去除产生乱码的数据,对数据类型的整理以及不同属性之间数据的加权操作等。本文具体的数据预处理方式有以下几种。
2.2.1 处理缺失值
在训练一个模型之前需要对数据进行预处理,因为用模型解决问题的最终效果取决于数据的质量和数据中蕴含有用信息的数量。在训练样本数据的实际模型中,原始数据可能会由于某些原因,存在一个或多个值的缺失。数据产生空缺值的原因有很多,也许是没有录入,也许是数据保存时产生了乱码,人为删除时导致的,也许本来数据就是缺失的。在表格中缺失值通常是以空值的形式或者是NA(Not A Number)存在的。如果直接忽视这些缺失值可能会造成算法无法处理这些空白项,触发异常情况。如果将包含缺失值的数据简单地全部删除也会造成数据的浪费,而且有时候数据量相对较少,删除包含缺失值的数据之后数据就更少,这将会大大地降低训练出模型的泛化能力。对数据的缺失值处理有以下三种方法:1.对于数据较多的情况,可以视情做一些删除处理。2.在不影响分析结果的基础上,可以适当地对缺失值进行填充。3.如果一行数据有多个缺失值,可以根据情况,对某些属性值进行删除,对另一些属性值进行填充。#p#分页标题#e#
...............................
第三章 武警警务数据预测模型的实现与测试.......................24
3.1 LSTM 模型...............................24
3.1.1 LSTM 模型的实现............................. 24
3.1.2 LSTM 模型结构............................... 25
第四章 总结与展望................................ 50
4.1 论文工作的总结.................................50
4.2 对未来工作的展望...................................51

第三章 武警警务数据预测模型的实现与测试

3.1 LSTM 模型
3.1.1 LSTM 模型的实现
在数据的处理工作准备完成后,就可以构建武警警务数据预测模型。在构建模型之前,需要搭建实验环境。实验环境如表 3-1 所示:

搭建好实验环境,就可以构造 LSTM 神经网络模型,构造模型步骤如下:
(1)首先划分训练集和测试集。这两者的划分可以依据原始数据特点,也可以随机划分,一般比例为 7:3。为了加速训练模型,本文根据数据的特征使用2008-2016 年数据作为训练集训练模型,然后使用剩下 2 年得数据进行评估。模型的输入变量和输出变量分别由训练集和测试集提供,最终需要转换数据格式。
(2)LSTM 模型中,初始设置时,假设隐藏层有 50 个神经元,输出层 1 个神经元,输入变量是一个时间步(t-1)的特征,损失函数采用 Mean AbsoluteError(MAE),优化算法采用 Adam,初始化模型采用 128 个 epochs 并且每个 batch的大小为 100。
(3)最后,在 fit()函数中设置参数,记录训练集和测试集的损失,并在完成训练和测试后绘制损失图。接下里就可以对模型效果进行评估。通过以上处理之后,再结合 RMSE(均方根误差)来描述实验数据是否具有好的精确度。
.........................

第四章 总结与展望

4.1 论文工作的总结
本文把原始武警警务数据处理后,运用机器学习的相关算法和理论知识,建立 LSTM 神经网络预测模型,帮助分析近几年湖南发生的事件内在联系,认清现实风险问题,提升各地武警部队决策的精确性和科学性,进而有效提升了部队战斗力。
本文先采集了 2008 年到 2018 年湖南省的武警警务数据信息。通过科学的统计方法获取了大量的武警警务数据,掌握这些数据,可以使管理者在很多方面建立信息优势,并根据这些数据建立合适的信息预测模型,能够进一步加强武警部队的执行力以及掌控力,节约大量的人力和物力,提升执行效率。但是由于原始的警务数据获取渠道众多,每个部门对数据的记录方式和统计情况不一致,往往导致许多信息的缺失以及数据更加驳杂。所以需要对原始警务数据进行一系列的处理。由于传统的武警警务数据的预测模型往往耗费更多的时间并具有较低的精确度,因此,本文中将警务数据和新兴领域相结合,以机器学习的算法和理论为依据,建立了可靠的武警警务数据预测模型,可以对城市发生某种事件的关联度进行合理的预测,帮助武警能够预知事件发生的地点和时间,提早做好防范工作,降低犯罪率,减少人们的伤亡。主要包含以下几个方面:
(1)进行大量数据采集工作。本文搜集了湖南各地区武警情报信息系统近几年的数据,由于互联网迅猛地发展,并广泛用于服务部队各个领域,每年产生了大量数据,其中伴随着大量无用的信息。在信息记录过程中,由于每个城市没有统一的记录规则,导致许多武警警务数据缺失信息;有时还要边搜集数据边清洗,然后再进行存储,很多时候都是手工和程序相结合的方式进行筛选,删除了大量缺失数据和特征值不发散的属性,补上了部分缺失的信息,并对数据进行合理的转换,这为警务数据信息的处理打下坚实基础。
(2)对搜集整理的数据进行预处理。在建立 LSTM 神经网络预测模型的过程中,先对各个地区的武警警务数据进行采集,运用机器学习的相关理论和算法,如:平均绝对值误差、均方根误差等多个算法。然后依据不同的参数设置,进行多次训练,最终建立了武警警务数据预测模型,帮助武警部队对未来某个时间段该城市可能发生的事件量进行预测,为人力物力的的分配提供合适的方法,把握事件发生动态,为其营造和平氛围,降低伤亡提供合理依据,达到资源利用最大化,创造和谐社会。
参考文献(略)

1,点击按钮复制下方QQ号!!
2,打开QQ >> 添加好友/群
3,粘贴QQ,完成添加!!