本文是计算机论文,社保审计大数据平台通过大数据数据采集技术实现了各分散社保系统的便捷化采集,并通过大数据清洗技术实现数据的高效清洗和抽取。通过分布式传输、分布式存储和分布式计算技术有效地解决已经面临和将要面临的大数据体量的瓶颈问题。在社保审计数据分析上更是采用了可视化建模、多维分析等技术,可以更加智能地挖掘数据,查找问题。大大提高了社保审计工作的工作效率,同时也提高了社会保障基金审计的信息化水平、智能化水平和现代化水平。实现全覆盖功能:通过采集行政公文、社保业务系统、财务软件系统的数据,辅以其他第三方数据,通过大数据采集清晰和传输技术,利用预警、查询、多维模型等开展系统化的探究,更深化地确认和分析相关的疑点,并组织相关的审计小组开展分散性核查,推动审计范围更广,这就能够对社保系统中所存在的问题进行集中、科学地反映,从而推动审计发挥更加有效地作用,节省更多的审计时间,促进审计效率的不断提升。
.......
第一章 绪论
本文在大量的调研工作和社会保障基金审计具体业务实践的基础上,依据相关规范制度,设计与开发了实用性较强的社保审计大数据分析体系。通过该社保审计系统,可以更好地实现对类型繁杂、数据体量巨大的社保数据及相关辅助数据进行采集、分类、汇总、分析及可视化输出。并且,通过系统规范审计业务流程,利用专题模型规范审计工作的具体操作流程,规范审计业务操作,达到最终统一。系统可以多元化的结合大数据数据分析技术手段,将宏观数据信息挖掘与具体疑点数据的系统分析相结合,扩大审计覆盖范围,提升审计工作效率,科学有效地揭示和预警我国社会保障制度运行的深层次问题及风险隐患,为政府宏观决策提供重要参考[25]。通过运用大量的系统分析模型,从宏观和微观层面进行结合分析,可以全面准确的把握历年来社会保障基金横向和纵向的发展情况,通过数据挖掘分析得出我国社会保障基金管理中存在的弊端和问题,揭露社会保障体制机制方面存在的管理缺陷,预警社保资金风险,从而提高审计结果的综合运用效益,为高层管理者提供更为科学合理的宏观决策依据[26]。
...
第二章 相关技术
2.1 相关技术规范
社保审计系统开发所涉及的行业规范、数据字典、审计事项等主要格式,严格执行信息系统建设行业规范性要求、审计署实务公告以及行业审计数据规划的规范标准。同时,结合地方社保审计发展的需要针对性的构建社保审计应用,确保整个审计工作和审计数据的规范统一。HBase适用于存储并处理大型的数据,且对硬件配置要求不高,也就是说只需要使用普通的硬件配置,我们就能够实现对成千上万的行和列所组成的大型数据进行批量高效的处理。本系统采用该技术在电脑服务器上搭建一个大规模结构化的存储集群,其分布式计算采用 Map Reduce,可以实现对大块的数据加载和执行全表扫描的操作功能等,文件存储系统采用 HDFS,将应用数据和协同数据独立开来,采用 Zookeeper 来完成状态管理通用协同任务。
2.2 Hadoop
框架Hadoop 本质上起源于 Google 的集群系统,Hadoop 是 Apache 软件基金会的顶级项目,包含了各种 hadoop 子项目。Hadoop 项目提供并支持开源软件的开发,该软件为开发高度可扩展的分布式计算应用程序提供了一个框架,这些应用程序目标是处理细节,使开发人员可以自由地专注于应用逻辑[30]。Google 采用 Linux PC 机组成集群的方式来实现各种应用的运行。Google 的基础设施方便用户的使用,在采集系统方面主要包括 GFS 和 Map Reduce 计算模型两个重要的组件。对于 GFS 来讲其实质上是一个分布式的文件系统,其主要的特点是能够实现对下层负载均衡和冗余复制等的隐藏,提供了统一的 API 接口实现与上层接口的链接[31]。 Map Reduce 中的 Map 能够将输入 Input 进行分解操作,将其分解成为 Key/Value 对,然后通过 Reduce 的功能最终实现输出 Output[5]。具体来讲 Hadoop 集群框架如图 2.1 所示。社保审计工作涉及到大量的业务台账、财务报表、账目等数据的录入核查工作。
........
第三章 系统需求分析......................................................... 16
3.1 业务概述..................................................................16
3.2 系统功能需求分析................................................. 19
3.3 数据需求分析......................................................... 25
第四章 系统设计与实现...................................................... 28
4.1 系统总体设计......................................................... 28
4.2 系统模块设计......................................................... 32
4.3 系统数据库设计..................................................... 48
第五章 系统测试及运行效果.............................................. 55
5.1 系统部署..................................................................55
5.2 测试环境..................................................................55
5.3 功能测试................................................................56
......
第五章 系统测试及运行效果
5.1 系统部署
通常来看,系统基础环境部署的重点是数据中心系统,其部署的主要内容有如下几个,即数据库安装方面、中间件方面、操作系统安装方面、设备安装方面等。系统环境主要考虑计算设备、存储设备、网络设备、基础软件和安全设备等社保大数据分析平台项目建设底层所需的相关资源配备,以保证平台的稳定高效运行。总体要求是在满足性能需求的同时,减少资源浪费的可能性。以审计人员通过手工作业,将各部门数据汇总,并需要使用到基本的数据运算,逐一翻阅凭证、账册等纸质资料,结合审计经验以期从中查到审计疑点或者线索等等。由于缺乏必要的信息化手段,针对台账、报表类数据的核查工作效率低下,并不适用于大规模的审计。另一方面,社保审计大数据平台为解决这些问题,采用一套构建在分布式文件系统之上的 MPP 数据库来实现业务台账、财务报表的数据录入,并提供在线的 SQL 查询功能,便捷高效的通过数据间的勾稽关系查出数据疑点。同时,空间数据也可解译成结构化数据存储在 MPP 数据库中,极大的保障空间数据存储的安全性。
5.2 测试环境
系统测试对象的功能测试,测试需求主要是所有可以直接追溯到用例或业务功能和业务规则的内容。目的是确保所有测试对象均能正常执行,且保证准确率,验证审计人员能否正确接受、处理和检索数据,以及业务规则得到正确执行等。测试方法主要采用黑盒方法。通过网页与应用服务之间的交互,进行分析输出测试结果,以验证应用程序的运行及其内部流程是否满足系统的需求。下面列出了每个函数的推荐测试方法概要如表 5.3 所示。界面测试主要采用常规性的用户界面(UI)测试,来验证系统用户与系统之间的交互情况。测试的目的是确保系统实现后,用户界面能够为用户提供便捷的操作和快速的访问、简单易懂的导航浏览等功能。此外,测试还确保用户界面功能内的对象符合系统开发时的预期需求,同时符合审计系统应遵守的行业规范等,系统界面测试内容如表 5.4 所示。
......
第六章 总结与展望
社保审计大数据平台通过大数据数据采集技术实现了各分散社保系统的便捷化采集,并通过大数据清洗技术实现数据的高效清洗和抽取。通过分布式传输、分布式存储和分布式计算技术有效地解决已经面临和将要面临的大数据体量的瓶颈问题。在社保审计数据分析上更是采用了可视化建模、多维分析等技术,可以更加智能地挖掘数据,查找问题。大大提高了社保审计工作的工作效率,同时也提高了社会保障基金审计的信息化水平、智能化水平和现代化水平。实现全覆盖功能:通过采集行政公文、社保业务系统、财务软件系统的数据,辅以其他第三方数据,通过大数据采集清晰和传输技术,利用预警、查询、多维模型等开展系统化的探究,更深化地确认和分析相关的疑点,并组织相关的审计小组开展分散性核查,推动审计范围更广,这就能够对社保系统中所存在的问题进行集中、科学地反映,从而推动审计发挥更加有效地作用,节省更多的审计时间,促进审计效率的不断提升。共享功能。通过与 AO 和 OA 系统的对接,实现了国家审计系统的数据信息共享的功能,并且还能够使得各个部门的审计工作相互协调,避免重复审计,推动不同的科室能够协调共进,提升其团结互助的能力,更好地发挥集中效能。
参考文献(略)