第 1 章 绪论
1.1 引言
随着计算机技术的不断发展,越来越多的软件和工具能够伪造出人们不能用肉眼鉴别出来的非随机图像,使人们生活受到计算机生成图像或者是计算机篡改图像的干扰,因此区分自然图像和计算机生成图像、计算机篡改图像的技术成为了各国科研人员研究的重点。自然图像的像素值不是由计算机随机决定而是由自然场景决定,因此肉眼能够轻易的区分自然图像和计算机随机生成图像。事实上自然图像像素值的概率分布不是随机的[1 -4],而是服从一定规律的,因而自然图像就含有能够鉴别自身的统计特征。既然如此那我们该如何提取这些统计特征?Hany Farid 把数字图像被动取证中特征提取的方法[5]分为 5 类:(1)基于像素,即通过检测在像素级层面上所表现出来的异常提取特征;(2)基于图像存储格式,提取该格式所引进的特殊特征;(3)基于图像获取设备构建该设备的光学模型,并提取该模型的统计特征;(4)基于自然场景检测光照和摄像机构成的三维空间中的异常,提取这些异常作为特征;(5)基于几何学提取检测特征。本文基于图像篡改所引起的变化,提取自然图像与篡改图像间的差异以及自然场景的统计规律作为图像的特征,形成本文特征提取算法。图像压缩编码器,模拟图像存储器,视觉系统等图像处理系统一般对包含自然场景的图像[1-2]进行处理,因此必须对该图像的结构和统计特征进行分析。
研究自然图像的目的是找出最能够抓住其本质属性的统计特征,在实际应用的促使下图像的统计特征得到发展,以前这类特征主要应用在生物视觉领域,现在已经逐步的引入到数字图像取证领域。本文在以下两个方面有较深入的研究:计算机生成图像(Computer Graphics, CG)和自然图像(Natural Image):计算机图像软件能够伪造出具有高度说服力、逼真的能够骗过肉眼的图像。区分这两类图像是一个很重要的任务,它能确保照片的真实性、完整性和原始性[6]。
1.2 背景意义及技术分支
1.2.1 数字图像被动取证的背景分析
电子媒体的照片还可信吗?这是信息时代面临的新问题。数码相机的诞生和应用,为人们获取图像提供了比传统摄影更大的便利,不需要暗室冲洗等加工环节,从数码相机显示屏可以即时看到所拍摄的照片效果;数码相机对自然景物图像进行处理,以数字化方式存储图像,然后把图像传到计算机,可以方便的对图像进行多种处理,比如对图像进行篡改;这样当图像通过互联网迅捷地传播时,人们将无法辨别图像的真实性,从而对互联网上的图片信息产生怀疑。大大降低了图像通过互联网可靠传播的可能性。另外,图像可以以多种方式被篡改,操作者利用手中便利的图像处理软件就可以实施这些操作,不能不说篡改图像的难度随着计算机技术的发展在不断的下降。目前流行的篡改手段主要有九种:
第 2 章 数字图像特征提取的理论架构..............................9
2.1 图像特征提取的原理..........................................................9
2.2 图像统计学 ............................................................ 12
2.3 图像预测 ............................................................ 13
第 3 章 数字图像被动取证算法研究......................... 17
3.1 问题分析 ........................................................... 17
3.2 自然图像 ...................................................................... 19
3.3 基于网函数插值法的数字图像被动取.................................. 20
3.4 拼接图像检测结果及其分析 .................................. 25
3.5 计算机生成图像检测结果及其分析.............................. 26
第 4 章 基于小波统计特征的图像拼接检测............................ 29
4.1 特征构造 ...................................................................... 29
4.2 特征量的提取 ............................................................... 35
第 5 章 总结与展望
5.1 研究总结
随着计算机技术的不断发展,越来越多的软件和工具能够伪造出人们不能用肉眼鉴别出来的非随机图像,使人们生活受到计算机生成图像或者是计算机篡改图像的干扰,因此区分自然图像和计算机生成图像、计算机篡改图像的技术就成为各国科研人员研究的重点。自然图像的像素值不是由计算机随机决定而是由自然场景决定,因此肉眼能够轻易的区分自然图像和计算机随机生成图像。事实上自然图像像素值的概率分布不是随机的,而是服从一定规律的分布,因而自然图像就含有能够鉴别自身的统计特征。本文主要工作内容包括以下几个方面:
1、分析导致现存数字图像被动取证算法应用范围受限的问题,试图找到一组特征能够增加取证算法的适用范围。
2、在不影响取证算法适用范围的条件下,使用高精度分类器提取最优分类面,努力使算法具有较高的正确率和较低的误检率,使其控制在可以接受的范围内。
3、为了减少图像对算法的影响提高检测算法的鲁棒性,通过对以前算法的分析,添加一些不依赖于图像具体内容的特征量。
4、为了进一步提高算法的效率,在不影响算法鲁棒性、正确率和适用范围的情况下,通过削减特征间的相关性,达到使特征向量中的特征的维数减少的目的。