隐马尔可夫模型在人脸检测与识别中的应用
【摘要】:人脸识别近十年来日益受到人们的关注,已成为信息学科研究的热点之一。人脸模式的差异性又使得人脸识别成为一个极富挑战性的课题。人脸检测和识别方法,大致可分为基于几何特征的方法、基于模板匹配的方法和基于模型的方法。基于模型的方法是通过统计分析和匹配学习找出人脸和非人脸以及不同人脸之间的联系。该方法的模板是通过样本学习获得而非人为设定,所以从原理上较为先进合理。HMM是采用概率统计的方法进行时序数据识别模拟的分类器,如果把时序序列看成应用对象的特征向量,1通MM也可以应用到人脸检测与识别,属于基于模型的方法。根据人脸由上至下各个区域(头发、额头、眼睛、鼻子和嘴巴)具有自然不变的顺序这一稳定的相似共性,个人特征仅表现在上述组成部分的形状及其相互连接关系不同,我们可用一个ID HMM表示人脸。本文中,我们最初将一维隐马尔可夫(ID HMM)应用于人脸检测和识别,采用条状窗口的KLT系数作为观测序列。实验性能表明,1 D HMM表现二维人脸模型存在不足.进一步研究表明人脸水平方向从左至右也具有相对稳定的空间结构,因此可将沿垂直方向划分的状态分别扩充为一个ID HMM。垂直方向的状态就称为超状态,水平方向嵌入的状态就称为子状态,共同组成了一个嵌入式隐马尔可夫模型(或称为伪二维隐马尔可夫模型,PZD扣叭M).PZD HMM可以更好的反映人脸的二维空间结构,更加精确的描述和定义具体人脸的个人特征.并且水平方向的状态变化仅限于超状态内,分析处理比真正的二维的隐马尔可夫模型(ZD.HMM)简单,是较好的描述和用于识别人脸的数学模型.在实验中也获得了比ID HMM更好的检测与识别效果。本文中,我们选取块状扫描窗的ZD DCT系数作为观测序列,使得观察向量维数得到减少,并且选择块状窗的大小与JPEG标准兼容。这样提取的观察向量,对JPEG压缩的人脸图像可以直接在压缩域进行识别,无需解压.基于HN压1的方法一般只使用“人脸”样本(正例样本)进行训练,反复学习,使扭以M参数对样本产生的概率最大,得到“次优化”训练模板,所以它存在一定局限性.与采用1 Dl王MM进行人脸识别相比,PZD HMM使得人脸识别的精确度增加了很多,同时训练和识别的复杂度也增加了很多,计算量很大.综合考虑二者的优缺点,结合支持向量机(s VM)对静态数据识别效率明显的长处,我们建立了SVM和HMM的混合人脸识别模型。SVM源于统计学习理论,它使用结构风险最小化(s RM)原理构造决策超平面使每一类数据之间的分类间隔最大.我们采用SVM取代高斯分布函数或者状态映射矩阵,每个人脸器官通过SVM进行识别,混合模型的复杂度相当于一个ID一HMM,所以在保证识别精度的前提下,模型较简练,大大减少了分析识别的时间.除此之外我们引入YCbCr肤色模型对图像进行肤色区域的初筛,得到人脸的可能区域,减少了后续步骤的检测范围。系统输出我们采用层次结构的判决,可以拒识新对象。首先判别是否人脸,若是判别是否库中已有对象的人脸,最后输出识别对象的标号.在ORL人脸库中,测试基于ID.HMM、PZD‘HMM和SVM汗D图M的人脸识别方法,识别率分别达到86.2%、97.2%和97.0%,并且以上方法对姿态和环境的变化具有较好鲁棒性。