上海论文网提供毕业论文和发表论文,专业服务20年。

IT审计之关联原则算法整改及应用概述

  • 论文价格:免费
  • 用途: ---
  • 作者:上海论文网
  • 点击次数:127
  • 论文字数:0
  • 论文编号:el201410241558136071
  • 日期:2014-10-24
  • 来源:上海论文网
TAGS:

1.绪论


1.1研究背景与意义
很多人会质疑,为什么IT审计会与关联算法有联系,为什么用关联算法应用在IT审计方面?又或者算法能用在IT审计的哪些方面呢?在如今信息化社会当中,由于计算机网络技术在商业活动例如企业经营管理活动之中迅速发展并广泛得到应用,计算机技术渗透到了各个行业中,而各个行业的审计工作也迎着时代的潮流,逐渐开展推广基于计算机技术的审计应用。首先,IT审计的范围非常广泛,最初从EXCEL表对例如序时账和科目余额表的应用到SQL Server数据库对数据进行运行脚本等软件的应用,ft到现在审计软件的不断创新开发和拓展应用,审计人员对审计工作基于计算机应用已有了巨大发展。而在审计工作中,可以明显看到目前应用关系数据库技术对海量数据基于审计条件进行蹄选以及大量数据关联管理。但是问题出现了,由于审计思想的局限,主要体现在审计人员面对目前越发复杂的企业间信息化程度的加深和频繁,他们的经验也是有局限性的。由于之前审计师对被审计单位的大量业务数据进行更深层次的分析都是基于原本审计的标准作业程序(Standard Operation Procedure),其方式是以通过发现数据之间潜在的隐藏关系作为一个个控制点对被审计单位的整体进行重点的穿行测试并发现问题,这些都可以被称作是传统的经典审计方法(之后的章节会涉及详细说明),但是传统的审计方法已经不足以支持目前庞大的数据,即使可以通过数据录入或者蹄选查询的方式来检测,但是这些数据中潜在的信息我们通过现有的审计SOP无法获取更多的有效“知识”,进一步来讲,就无法对被审计单位数据进行更深层次的分析。大量潜在需要被挖掘数据积累越来越多,根据以往的经典审计方法己经不足以挖掘出足够多的审计人员需要得到的有效信息。因此,这就是人们常说的“数据丰富而信息贫乏”的遞她处境。
………..


1.2国内外研究现状
对于事务数据库和关系数据库的关联规则研究相对于所有学科是属于新兴边缘的,对其研究和成果涉及了包括数据库知识、管理信息系统和人工智能等等很多领域,对其研究最有影响力的可谓是R.Agrawal等人于1993年提出关联规则的挖掘问题。从二十世纪九十年代到现在,针对关联算法的研究有很多,下面就从国内外方面进行介绍。最早对关联规则研究提出想法的就是IBM的R.Agrawal,而到目前,关联规则的理论研究己经分出以下几个主要改进方向。例如多周期循环算法:其核心为分层算法,即把算法过程分为几个层次,每个层次挖掘完毕之后,再加入到最后的结果。类似的算法包括Apriori算法、还有最有影响力算法之一的FP-growth,还有很多改进算法,例如 AIS 和 AprioriHybrid 以及 Apriori-Tid 算法;Savadere 等人提出的 Partition改进算法,以及park等人提出的DHP算法、Toivonen的抽样算法等等。虽然这类算法很多,但仍有挖掘空间。例如Toivonen提出的基于抽样(sampling)的算法,优势在于只扫描一次数据库,但会产生较多的候选项集。Zaki等人提出用形式概念分析研究频繁项集的瓶颈问题,还有为处理用户指定阈值,或者研究提取模式的后处理问题,利用聚类对分组进行处理,还有研究者提出可以根据主管度量来判断规则是否为用户关心的想法。当然,关联规则还有发展到多维多层或者多值领域,区别丁-布尔型关联算法,G. Michael提出按区间区分值域,但会出现规则组合爆炸的问题;而R. Srikant等提出的Cumulate、stratify以及Han等提出的IVIL—T2L1及其变种算法都为以概念层为主旨的挖掘多层关联规则算法。对于特定领域关联规则应用更是数不胜数。可以说在国外对关联规则的研究领域非常广泛并且丰富。
……….


2. IT审计风险控制


2.1什么是IT审计
IT审计是除了像纸质或者传统审计方法可以覆盖的范围以外,包括依靠计算机程序的数据以及一部分需要手工记账的都属于IT审计范围。既包括程序控制,也包括手工控制。如何区分手工控制何时需要进行IT审计,例如被审计单位序时账在年底关账期间的手工调整,又或者机房备份批处理作业的人工检测都属于IT-dependent manual controls,既是依靠计算机程序运行数据,又需要人为修改数据或者进行检查。而如图2.2中可以看到IT审计重点关注的几个主体分别为应用系统、数据库、硬件平台、网络安全以及物理安全。上图2.3为IT审计做穿行测试主要测试的三个方面,既是结合了图2.2所阐述的被审计单位的各个主体和计算机控制流程和手工人为有干预的流程在一起。下面开始介绍IT审计一般审计所做穿行测试的三大方面控制点,即图2.3所包含的变更管理、逻辑访问和其他IT控制。

……..


2.2 IT审计控制点
这里沿用/ GAM纲领中对IT审计的标准设定。首先我们来了解穿行测试,测试和评估IT审计中所描述的我们对IT审计范围内的穿行测试。审计工作人员选择每个穿行测试的一次发生案例作为样本来执行穿行测试。穿行测试包含所适用的手动和自动的IT审计,这里就包括人工的,或者完全依靠电脑的审计范围等等。在执行穿行测试时,IT审计工作人员采用能够帮助识别和评价该测试的框架——IT审计中的主要控制程序(PCP)。PCP框架中涉及所有的控制点,可分为三个种类:管理变更(Manage change)逻辑存取(Logical access)其他 IT '一般控制(Other ITGCs, including IT operations)对于计划依赖IT审计的应用程序,审计工作人员应对能够达到每个相关“IT审计种类”目标的IT审计执行穿行测试。IT审计的失败可能对会计报表或披露产生影响时,应包括“其他IT审计”种类。这三类目标已经囊括了国内对于安全的计算机网络系统应支持的六个目标。完整性(Integrity):确保数据没有遭受以非授权方式所作的篡改或破坏。这是关于系统的任何资源、数据或文件、进程或应用的完备性、正确性、时效性及源发性的一种特征。机密性(Confidentiality):防止信息或系统进程泄漏出去。信息经通信链路传送或在计算机存r:媒体上记录时就可能发生直接泄漏的危险。可鉴别性(Authenticability):鉴别用来验证系统实体和系统资源(如用户、进程、应用)的身分。可用性(Availability):得到授权的实体在有效的时间内能够访问和使用其所要求的数据。防抵赖(No Radiation):避免在一次通信中涉及到的那些实体之一不承认参加了该通信的全部或一部分。审计(Audit):能够对已经或者可能出现的网络安全问题提供调査的依据和手段。对违反系统安全规定的实体,可正确地追踪出该实体的行为和责任。这是系统解决问题的必要组成部分。PCP框架中包括的IT审计控制点列示在《S07_附录1针对IT 一般控制类别的主要控制程序和其他考虑》内。参考该附录可以获得每个IT审计穿行测试的PCP详细内容。所选择进行穿行测试以评估设计有效性及IT审计控制点是否按描述被执行的每个穿行测试发生,也可以用来满足审计工作人员按照PCP来运行有效性测试。
……..


3.关联规则算法现有研究及改进....... 21
3.1关联算法概述...... 21
3.1.1经典的Apriori算法过程及步骤...... 23
3.1.2 经典Apriori算法瓶颈 ......25
3.2现存改进思想...... 26
3.3 Advanced-Apriori 新算法...... 26
3.4验证新算法效率...... 31
4.新关联规则算法在IT审计应用...... 34
4.1新算法在用户访问实例的验算...... 34
4.2传统IT审计实务比对 ......39
4.3对于改善IT审计的意义...... 40
5. 总结与展望 ......41


4.新关联规则算法在IT审计应用


4.1新算法在用户访问实例的验算
如图4.1和图4.2分别为我在审计过程中获取到的审计凭证,由于证据需要保密,因此密码使用登记簿中的动态密码和联系方式已经隐去。图4.1中虽然为某被审计单位的密码使用登记簿,但为该11层机房的密码记录,因此不仅涉及安全参数中的密码管理的控制点,也涉及了机房迸出权限和用户账号权限是否恰当等等。而图4.2中记录的除了密码使用登记簿中记录的该使用人登录信息以外的操作信息。当然,由于信息量庞大,在这里只截取了密码使用登记簿的几天信息和运行室日常操作簿的一天截图作为参考,数据库中的其他信息可参照该图。将图4.1和图4.2中以及其他的一些信息作为数据一一记录在表格中,会发现每个事务t如图表4.1中显示,因此我们将包括时间、系统、使用者用户名以及操作行为转为一个个信息进行记录,并将一行信息作为一个整体事务进行处理,如表4.2中将这些信息分门别类记录为一个个事务中的组成元素。
……….


结论


综上所述,为本文所述重点,包括挖掘IT审计控制点中的漏洞,为降低审计风险而采用关联算法,包括研究算法中的瓶颈问题,并学习现存的思想和方法并将其糅合消化并生成新算法,最后再通过与经典算法例子比较效率,与IT传统审计方法比测试效果。虽然成就感觉有很多,但针对关联规则的算法改进并没有那么理想,例如关联算法中很多的想法没有实现,FAHA算法等等都没能过釆取他们的想法;就算法本身而言,新算法中包括压缩数据库这些想法也有待提高,删除无用事务之后也需要多次扫描数据库,如果数据库量大一样也会产生瓶颈;当然也有很多的方法结合没有试验过,流程图中很多的条件判断没有想过更简洁的方式,或者频繁1项集与Lu的长度对比来判断是否选用自连接方式来生成候选集,或许这其中是否可以加入一个参数来进行判断,这些都可以是需要之后继续研究。#p#分页标题#e#
 
…………
参考文献(略)

1,点击按钮复制下方QQ号!!
2,打开QQ >> 添加好友/群
3,粘贴QQ,完成添加!!