1绪论
1.1研究背景
随着科技的飞速生长,以传统的3G、WLAN和近来方才发放派司的4G为主的移动网络正渐渐成为当下最重要的网络信息交互平台。移动互联网已经一跃成为现在天下生长最敏捷,远景最被看好的行业,比年来它的用户增长速率是任何预测家都未曾预推测的,据团结国部属机构国际电信同盟(ITU)统计,到2013年末,环球移动互联网毗连数已经到达68亿,与当前环球总生齿根本同等,环球移动互联网用户数己经到达20亿;数据表现,现在,环球近50%生齿已被3G网络笼罩⑴。而在中国,iiMedia Research最新公布的《2013中国移动互联网生长陈诉》也表现,停止到2013年11月,中国移动互联网用户数目己经凌驾了 6亿,并且用户数目在将来还将连续增长。随着智能化飞速生长,中国移动互联网用户数目已经渐渐逼近传统互联网用户数目,预计在2014年中国移动互联网用户数目就将逾越传统互联网,从而手机将成为第一上彀终端[2]。
然而现有的传统互联网信息监管技术手段很难应用到移动互联网中,对移动互联网缺乏有效的管控和保护手段。而且由于信息安全威胁都是来自移动应用或者网站的内容,而传统的入侵检测和防火墙等技术主要是用来防御和检测网络攻击行为的,这使得它们很难全面地保护移动网络信息的安全,因此,移动安全审计就成为不可或缺的安全监管手段16]。
针对上述传统监管技术的不足,本文将模式匹配技术引入到移动互联网内容安全审计当中来解决问题。移动互联网内容安全审计是针对移动用户上网信息内容的记录和审查,通过分析和过滤可疑信息、非法信息等,对网络进行动态实时监控;通过审查非法和违规内容,记录相关数据和信息来源,作为事后追宄的证据。也就是说,移动互联网内容安全审计系统不但能够监视和控制来自于非法网站和应用的敏感信息,还能够监视移动用户自己发布或者传播非法信息,可以事前控制用户的非法访问和传播,并能事后提供相应的电子证据,防止狡辩抵赖。因此,设计和研宄移动互联网内容安全审计系统对于社会经济和社会安全稳定都十分重要,具有重要的社会效益和经济意义。
...............................
1.2国内外研究现状
网络的安全审计技术还属于新兴的领域,国内外对这个领域的研究还属于起步阶段,市场上比较成熟的网络安全审计产品也非常少,尤其是移动互联网的安全审计,更是一个空白。
美国 James P.Anderson 公司早在 1980 年通过《Computer Security ThreatMonitoring and Surveillance》报告第一次提出了 “安全审计”的概念[7],但是直到90年代中期,才出现了首个具有可用性的网络安全审计软件“SATAN” [8]。近年来,国外也推出了一些流行的网络安全审计产品,但大部分都是基于国际上的互联网标准化,而没有相对的主要针对移动互联网的技术标准。而且由于移动互联网络安全审计的特殊性,要求安全审计系统必须对移动终端的网络应用进行支持,例如对IM(Instant Messaging)应用的限制,国外的安全审计软件支持的大都是MSN、Skype、Twitter、Yahoo Messager等,而国内的用户关注的是移动QQ、微信、微博、阿里旺旺等[9]。因此,国外的安全审计系统在很大程度上不适用于国内的实际情况。
国内主要安全审计产品提供商典型的有汉邦、启明星辰、天融信、浪潮、绿盟等。前期产品主要面向传统互联网,近年开始针对移动互联网进行了开发升级,并开始推出实用化产品。汉邦软科的"信息安全综合强审计监控系统”包括主机传感器、网络引擎、审计中心三大部分,采用分布式、模块化的设计思想,主要提供网络行为审计、违规内外联监管、数据库操作审计、主机授权管理等功能。启明星辰的“天明网络安全审计系统”采用了网络监测引擎、数据管理和网络审计单元三级结构,能够釆集、分析和识别网络的数据包,监控并记录网络运行状态以及网络事件,及时发现安全隐患,并采用关键词匹配方法对网络访问的相关信息进行分析和安全审计。天融信的“综合安全审计系统”通过收集各种网络资源和应用系统日志,集中到统_的操作管理平台来分析和处理,从而完成对网络和系统的安全审计。浪潮的网络信息安全智能审计产品,主要定位于高端电信级应用,由安全监控审计中心、数据内容管理中心、网络智能监测和运维支持系统组成,其特点是能够针对最终用户和运营服务要求对网络行为、信息内容等进行深度监测审计。
.............................................
2安全审计的基本理论
2.1安全审计概述
安全审计不但可以对网络内部和外部的用户举动举行监控,辨认、阐发、记载和存储安全相干运动的信息,报警和相应突发环境,还可以记载体系变乱,给过后追责提供紧张证据,给网络非法举动和犯恶举动提供取证依据由于天下上没有在绝对宁静的体系,以是安全审计体系可以共同其他安全羁系步伐利用,互为帮助、互为增补,从而全面包管体系的宁静。
安全审计是以传统审计学为基础,又融合了行为科学、计算机安全、人工智能、信息管理学等学科,交叉出来的一门新的学科。它与传统的审计概念不同,安全审计是用来审查和评价计算机网络信息安全领域中的安全控制和事件。
国家标准GB/T20945-2007《信息安全技术:信息系统安全审计产品技术要求和测试评价法》给出了安全审计的定义,安全审计是监测、采集并分析信息系统的各类事件和行为,而且对于特定的事件和行为给出报警。国际标准ISO/IEC15408(CC准则)比较具体地定义了网络安全审计的概念和功能,网络安全审计是指识别、分析、记录和存储涉及到网络安全的行为的有关信息,同时对网络上发生的和安全相关的活动进行审查,并且查找安全相关活动的责任人。一般来讲,安全审计是指根据一定的安全策略,通过记录和分析历史操作事件及数据,发现能够改进系统性能和系统安全的地方。
.....................................
2.2安全审计系统的体系结构
根据审计的事情方法,安全审计可分为会合式体系机谈判漫衍式体系布局。会合式体系布局,釆集和阐发数据元(网络其他设置装备部署的初始宁静审计记载),将全部数据都交给中间处置处罚机举行会合的宁静审计;漫衍式体系布局一样通常具有两种情势,一种是审计漫衍式网络的安全环境,另一种是应用漫衍式盘算技能来审计数据元的安全[18]。
一般而言,一个完整的安全审计系统如图2-1所示,包括事件探测及数据釆集引擎、数据管理引擎和审计引擎等组成部分,每一部分实现不同的功能【19]。
(1)事件探测及数据采集引擎。事件探测及数据釆集引擎主要全面侦听主机及网络上的信息流,动态监视主机的运行情况以及网络上上流过的数据包,对数据包进行检测和实时分析,并将结果发送给相应的数据管理中心进行保存。
(2)数据管理引擎。数据管理引擎一方面负责对事件探测及数据釆集引擎传回的数据以及安全审计的输出数据进行管理,另一方面,数据管理引擎还负责对事件探测及数据采集引擎的设置、用户对安全审计的自定义、系统配置信息的管理。它一般包括引擎管理、数据库管理、配置管理三个模块。引擎管理程序设置事件探测及数据釆集引擎的信息,数据库管理模块设置数据库连接信息,配置管理可以根据需求自己设定安全审计对象、协议以及异常端口,如设置黑白名单、配置审计对象等。
....................................
3 内容审计关键技术研究..................................... 21-51
3.1 模式匹配算法与内容审计 ................21-32
3.1.1 模式匹配算法的基本原理 ......................21-22
3.1.2 单模式匹配算法及相关改进算法的研究现状 .....................22-26
3.1.3 多模式匹配算法及相关改进算法的研究现状................ 26-32
3.2 基于BM改进的单模匹配算法研究........................ 32-39
3.2.1 BM算法及各改进算法的不足分析 ...............................32-33
3.2.2 BMMA算法 ............................33-37
3.2.3 BMMA算法的性能分析 ...........................37-39
3.3 基于WM改进的多模匹配算法研究 ..................39-50
3.3.1 WM算法及各改进算法的不足分析 ....................39-40
3.3.2 关键词权重科学度量TF-IDF ......................40-42
3.3.3 WMMA算法............................. 42-48
3.3.4 WMMA算法的性能分析...................... 48-50
3.4 本章小结 ............................50-51 #p#分页标题#e#
4 移动互联网内容安全审计系统的设计与实现
在本章将以第3章提出的模式匹配改进算法为基础,并结合其他系统搭建所需要的知识,对移动互联网内容安全审计系统进行设计和实现。
4.1移动互联网内容安全审计系统的设计
移动互联网内容安全审计系统主要是针对移动网络的信息数据安全进行审计,下面将对系统的功能需求和特殊的设计要求进行具体的描述。
4.1.1 系统功能概述
移动互联网是一个新兴的开放平台,用户可以通过移动网络来进行以前传统互联网的操作,比如浏览网页、收发邮件、移动应用等等。但是传统的互联网监管手段己经比较成熟,在新兴的移动互联网领域中,信息的监管还不太成熟,很多在互联网不合法的内容在移动互联网上还是能流传,所以通过对移动互联网内容安全的审计,来净化移动互联网上的信息、规避违法或者有煽动性的信息,具有重要的意义。
与一般的内容审计系统不同,移动互联网内容安全审计系统主要针对移动互联网中的文本数据进行分析、过滤,采用单模式和多模式匹配相结合的方式,审计用户的上网信息和邮件信息等文本内容,为移动互联网安全提供实时监控、事后追溯、违规阻断的能力[%。所以在设计移动互联网的内容安全审计系统时,需要特别考虑的是系统要具有较高的实时性,能够保证对移动网络中的海量数据进行实时处理,同时还要保证信息审计的准确性,而且还要具备主动防御的功能,可以对非法信息进行屏蔽,针对移动终端用户动态地进行网络访问数据的安全审计。
...................................
总结
为了设计和实现移动互联网内容安全审计系统,本文将模式匹配方法应用于内容审计模块的构建中,针对单模式匹配算法和多模式匹配算法进行了研究,完成的工作归纳如下:
1.研宄了安全审计的基本理论和分析方法,针对移动互联网内容安全审计,选择了模式匹配算法来实现本文的移动互联网内容安全审计系统,并介绍了当前各种比较常用的单模式和多模式匹配算法,比较分析了它们各自的特点和存在的不足。
2.针对中文语境中关键字出现的概率分布不均匀的特点,提出了基于汉字频率改进的BMMA单模式匹配算法。在进行匹配判定的时候根据关键字出现的概率进行优先匹配,从而减少二次匹配的次数,提髙匹配效率,使之更加适用于中文语境。
3.针对WM算法的不足进行了改进,提出了 WMMA算法,取消了前缀表PREFIX,节约了相应的查询时间和存储空间,并且引入了新的尾字表,在汉字模式串普遍较短的情况下,通过其来减少hash计算的次数,避免过短的模式串给系统增加过多的hash计算负担,并且在多模式匹配中本文应用了 TF-IDF关键词权重的不同来进行优先的匹配,从而提高算法整体的效率,也让改进后的算法更加适合中文语境下的移动互联网内容安全审计系统。
4.根据移动互联网内容安全审计的需求和特点,对移动互联网内容安全审计系统进行设计和实现。该系统包含数据采集、数据解析、规则库管理和内容审计模块四个主要功能模块。该系统通过代理数据采集服务器对移动用户的网络访问进行数据信息抓取和处理,然后通过匹配规则库设定关键词,最后通过内容审计模块中的单模式与多模式匹配算法模型进行内容安全审计。论文设计的系统经过系统性能测试,实现了移动网络内容安全审计的基本功能并且在响应时间上对用户的操作体验影响微乎其微,达到了设计要求。
................................
参考文献(略)