第2章论文涉及的相关理论基础
2.1人脸识别的基本理论
我们生活在一个繁忙的信息社会中,每一天都会和一些人碰面,也难免和一些人通过网络进行虚拟碰面,至于对方是谁,我们可以通过其面像认出来,而且在这两种场景下对于对方身份的识别来说都不会有什么差别,甚至对方是双胞胎中的一员,我们都可以通过其面部特征的微小差异来识别出对方的身份。这足以说明我们人类的面部结构是相同的(均包括:头发、额头、眉毛、眼睛、鼻子、双颊、嘴巴和下巴)而且每一个人的面部特征是独一无二的,是可以通过其面部图像来识别的。仔细分析一下这一奇妙的过程,不难发现这一过程包括了四个步骤:1.人脸检测:根据人脸的组成结构,检测出人脸在图像中的区域。2.排出干扰:排出外界因素对人脸图像的影响,比如:光照的影响、视角的影响、表情的影响以及其它物件的影响。3.特征提取:在人脸区域内通过观察获取人脸独一无二的面部特征,比如:脸型、眼睛、嘴巴、鼻子等每一个人所特有的特征。4.特征分类:根据观察所获取的面部特征,和大脑中自己熟悉的或者是认识的面部特征进行比对,识别出对方的身份。当然这是通过我们人类的视觉系统和大脑进行处理最终获得的结果,但是由于我们生活在一个信息化的社会中,人们希望通过信息技术手段来模拟这一过程使得计算机可以来完成这一过程,以便降低我们人类的工作量,因此我们可以形式化的定义以上讨论的人脸识别的一般过程。
仔细分析之后可以发现,任何一幅包含人脸的图像均包括以下四个要素:1.人脸属性:包括人脸表面的反射属性(如反射系数等)、人脸形状(表面法向量方向)、人脸表情、胡须等属性;2.场景属性:包括场景中物体表面的反射属性,物体的形状等。3.成像条件:包括光源位置和强度、其它物体(比如眼镜、帽子)以及人体其它部位(比如头发)对人脸的遮挡等;4.相机成像参数:包括摄像机位置、摄像机的焦距、光圈、快门速度等成像参数。
2.1.1人脸的表示
在人脸识别方法中人脸图像通常以向量或者矩阵的形式表示,而这些向量或者矩阵被看作是某一空间中一个点的坐标,所以通常情况下将人脸图像中的每一个像素值看作是人脸图像所在空间中相应维度上的坐标值,比如:在ORL库中每一幅人脸图像的分辨率为112X92,则认为这些图像属于某一 10304维空间,此高维空间中共有10304个维度,而ORL库中的每一幅图像均是此高维空间屮的一个点,这些图像中的每一个像素值就是对应维度上的坐标值。因此,本文中以后提到的维度均是此概念。
2.1.2基于主成分分析的人脸特征提取方法理论基础
主成分分析是建立在统计特性基础上的一种正交变换,其基本思想是在数据最小重建误差准则下,寻找一组正交基,对输入数据进行投影变换,将输入数据变换到由正交基所构成的坐标系中,通过保留数据分布方差较大的那一部分分量,来达到数据降维和特征提取的目的,因此主成分分析变换是均方误差意义下的最优变换,它是广泛应用的数据降维方法之一,并且在不同的应用领域都获得了很好的效果在人脸识别领域中主成分分析被用于人脸特征提取,从本质上来看人脸特征提取的过程其实就是数据降维的过程。为了方便本文中其它部分的讨论,下面将其原理进行简单介绍。
第2章论文涉及的相关理论.........................12
2.1人脸识别的基本理论........................12
2.2信息熵的基本理论........................ 21
2.3人脸识别中核方法的基本理论........................22
2.4本章小结........................24
第3章基于熵的局部特征保留........................25
3.1基本思想........................25
3.2基于熵的局部特征保留........................25
3.3基于熵的局部特征保留处理........................27
第4章基于熵局部保留主成分分析的........................31
4.1主成分分析方法(PCA)........................31
4.2熵局部保留主成分分析........................33
4.3实验及结果........................34
第5章基于熵局部保留完全二维主成分........................40
5.1完全二维主成分分析方法(C2DPCA)........................41
第7章总结与展望
7.1工作总结
人脸识别领域是一个具有广泛需求的领域,具有很大的发掘潜力,因此在这一领域有着众多的研究者,他们分别从不同的角度,使用不同的理论和技术提出了很多的方法,基于全局统计的方法就是其中很重要的一个分支。本文针对基于全局统计方法存在的不足,参照Fisher准则,并根据人脸图像的统计特征,提出了基于信息熵的局部特征保留方法,并将其与主成分分析法、完全二维主成分分析法以及核主成分分析法进行融合,提出了相应的人脸识别方法,提高了识别率。
具体说来,本文具有以下创新点:
1.基于信息熵,提出了基于熵的局部特征保留方法。信息熵是一种衡量随机变量不确定性的工具,随机变量取值的分布越集中其熵越小,反之熵越大,当随机变量的取值服从均匀分布时,熵最大。通过认真分析,发现同一个人的人脸图像不管光照、姿态以及饰品如何变化,人脸绝大多数维度上取值的分布都比较集中,但是不同人之的人脸图像各维度的取值又比较分散。在此基础上,本文提出了局部特征保留方法,将人脸图像的每一维度作为是一个随机变量,使用熵来度量其取值的不确定性,并根据人脸图像库中图像的特点,提出了各维度重要性的判别准则,然后根据这一判别准则,为各维度设置一个相应的系数,对重要维度的特征进行保留,其余的进行相应的减弱,达到除冗余排干扰的目的。
2.将基于熵的局部特征保留方法与主成分分析法融合,提出了基于熵局部保留主成分分析的人脸识别方法。