python实现人脸识别经典算法(一) 特征脸法


Posted in Python onMarch 13, 2018

近来想要做一做人脸识别相关的内容,主要是想集成一个系统,看到opencv已经集成了三种性能较好的算法,但是还是想自己动手试一下,毕竟算法都比较初级。

操作环境:python2.7

第三方库:opencv for python、numpy

第一种比较经典的算法就是特征脸法,本质上其实就是PCA降维,这种算法的基本思路是,把二维的图像先灰度化,转化为一通道的图像,之后再把它首尾相接转化为一个列向量,假设图像大小是20*20的,那么这个向量就是400维,理论上讲组织成一个向量,就可以应用任何机器学习算法了,但是维度太高算法复杂度也会随之升高,所以需要使用PCA算法降维,然后使用简单排序或者KNN都可以。

只当搬运工,送上链接。

PCA ,这篇博客讲得非常好了,从原理到实现基本看这个就能搞出来了:PCA的数学原理

特征脸法:PCA应用在人脸识别当中:人脸识别经典算法一:特征脸方法(Eigenface) ,这里与PCA有不同的操作就是特征值分解的时候,由于图像组成的列向量维度太高,直接按照PCA算法求解会很慢,所以这里有一种特殊的处理方法。

数据组织形式为若干样本图片分类放入对应文件夹中,然后在统一存放入face文件夹下,测试图像单独一张图像即可。

另外,由于PCA中维度是一个很麻烦的事情,所以在程序中,我打印了很多维度信息,有助于我们理解PCA的工作过程和调试。

代码如下:

#encoding=utf-8 
import numpy as np 
import cv2 
import os 
 
class EigenFace(object): 
 def __init__(self,threshold,dimNum,dsize): 
 self.threshold = threshold # 阈值暂未使用 
 self.dimNum = dimNum 
 self.dsize = dsize 
 
 def loadImg(self,fileName,dsize): 
 ''''' 
 载入图像,灰度化处理,统一尺寸,直方图均衡化 
 :param fileName: 图像文件名 
 :param dsize: 统一尺寸大小。元组形式 
 :return: 图像矩阵 
 ''' 
 img = cv2.imread(fileName) 
 retImg = cv2.resize(img,dsize) 
 retImg = cv2.cvtColor(retImg,cv2.COLOR_RGB2GRAY) 
 retImg = cv2.equalizeHist(retImg) 
 # cv2.imshow('img',retImg) 
 # cv2.waitKey() 
 return retImg 
 
 
 def createImgMat(self,dirName): 
 ''''' 
 生成图像样本矩阵,组织形式为行为属性,列为样本 
 :param dirName: 包含训练数据集的图像文件夹路径 
 :return: 样本矩阵,标签矩阵 
 ''' 
 dataMat = np.zeros((10,1)) 
 label = [] 
 for parent,dirnames,filenames in os.walk(dirName): 
  # print parent 
  # print dirnames 
  # print filenames 
  index = 0 
  for dirname in dirnames: 
  for subParent,subDirName,subFilenames in os.walk(parent+'/'+dirname): 
   for filename in subFilenames: 
   img = self.loadImg(subParent+'/'+filename,self.dsize) 
   tempImg = np.reshape(img,(-1,1)) 
   if index == 0 : 
    dataMat = tempImg 
   else: 
    dataMat = np.column_stack((dataMat,tempImg)) 
   label.append(subParent+'/'+filename) 
   index += 1 
 return dataMat,label 
 
 
 def PCA(self,dataMat,dimNum): 
 ''''' 
 PCA函数,用于数据降维 
 :param dataMat: 样本矩阵 
 :param dimNum: 降维后的目标维度 
 :return: 降维后的样本矩阵和变换矩阵 
 ''' 
 # 均值化矩阵 
 meanMat = np.mat(np.mean(dataMat,1)).T 
 print '平均值矩阵维度',meanMat.shape 
 diffMat = dataMat-meanMat 
 # 求协方差矩阵,由于样本维度远远大于样本数目,所以不直接求协方差矩阵,采用下面的方法 
 covMat = (diffMat.T*diffMat)/float(diffMat.shape[1]) # 归一化 
 #covMat2 = np.cov(dataMat,bias=True) 
 #print '基本方法计算协方差矩阵为',covMat2 
 print '协方差矩阵维度',covMat.shape 
 eigVals, eigVects = np.linalg.eig(np.mat(covMat)) 
 print '特征向量维度',eigVects.shape 
 print '特征值',eigVals 
 eigVects = diffMat*eigVects 
 eigValInd = np.argsort(eigVals) 
 eigValInd = eigValInd[::-1] 
 eigValInd = eigValInd[:dimNum] # 取出指定个数的前n大的特征值 
 print '选取的特征值',eigValInd 
 eigVects = eigVects/np.linalg.norm(eigVects,axis=0) #归一化特征向量 
 redEigVects = eigVects[:,eigValInd] 
 print '选取的特征向量',redEigVects.shape 
 print '均值矩阵维度',diffMat.shape 
 lowMat = redEigVects.T*diffMat 
 print '低维矩阵维度',lowMat.shape 
 return lowMat,redEigVects 
 
 def compare(self,dataMat,testImg,label): 
 ''''' 
 比较函数,这里只是用了最简单的欧氏距离比较,还可以使用KNN等方法,如需修改修改此处即可 
 :param dataMat: 样本矩阵 
 :param testImg: 测试图像矩阵,最原始形式 
 :param label: 标签矩阵 
 :return: 与测试图片最相近的图像文件名 
 ''' 
 testImg = cv2.resize(testImg,self.dsize) 
 testImg = cv2.cvtColor(testImg,cv2.COLOR_RGB2GRAY) 
 testImg = np.reshape(testImg,(-1,1)) 
 lowMat,redVects = self.PCA(dataMat,self.dimNum) 
 testImg = redVects.T*testImg 
 print '检测样本变换后的维度',testImg.shape 
 disList = [] 
 testVec = np.reshape(testImg,(1,-1)) 
 for sample in lowMat.T: 
  disList.append(np.linalg.norm(testVec-sample)) 
 print disList 
 sortIndex = np.argsort(disList) 
 return label[sortIndex[0]] 
 
 
 def predict(self,dirName,testFileName): 
 ''''' 
 预测函数 
 :param dirName: 包含训练数据集的文件夹路径 
 :param testFileName: 测试图像文件名 
 :return: 预测结果 
 ''' 
 testImg = cv2.imread(testFileName) 
 dataMat,label = self.createImgMat(dirName) 
 print '加载图片标签',label 
 ans = self.compare(dataMat,testImg,label) 
 return ans 
 
 
if __name__ == '__main__': 
 eigenface = EigenFace(20,50,(50,50)) 
 print eigenface.predict('d:/face','D:/face_test/1.bmp')

 以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
wxpython 最小化到托盘与欢迎图片的实现方法
Jun 09 Python
python bottle框架支持jquery ajax的RESTful风格的PUT和DELETE方法
May 24 Python
Python 中导入csv数据的三种方法
Nov 01 Python
pandas每次多Sheet写入文件的方法
Dec 10 Python
python实现求特征选择的信息增益
Dec 18 Python
python实现中文文本分句的例子
Jul 15 Python
python web框架中实现原生分页
Sep 08 Python
python使用Matplotlib改变坐标轴的默认位置
Oct 18 Python
tensorflow 实现数据类型转换
Feb 17 Python
Python爬虫程序架构和运行流程原理解析
Mar 09 Python
PyCharm 2020.2 安装详细教程
Sep 25 Python
python爬虫scrapy图书分类实例讲解
Nov 23 Python
tensorflow实现softma识别MNIST
Mar 12 #Python
wxpython实现图书管理系统
Mar 12 #Python
人生苦短我用python python如何快速入门?
Mar 12 #Python
tensorflow实现KNN识别MNIST
Mar 12 #Python
Python操作MySQL模拟银行转账
Mar 12 #Python
python3 图片referer防盗链的实现方法
Mar 12 #Python
tensorflow构建BP神经网络的方法
Mar 12 #Python
You might like
php中目录,文件操作详谈
2007/03/19 PHP
测试您的 PHP 水平的题目
2007/05/30 PHP
php模板之Phpbean的目录结构
2008/01/10 PHP
php读取excel文件示例分享(更新修改excel)
2014/02/27 PHP
php调用C代码的实现方法
2014/03/11 PHP
PHP统计数值数组中出现频率最多的10个数字的方法
2015/04/20 PHP
PHP中实现中文字串截取无乱码的解决方法
2018/05/29 PHP
PHP mongodb操作类定义与用法示例【适合mongodb2.x和mongodb3.x】
2018/06/16 PHP
JavaScript delete操作符应用实例
2009/01/13 Javascript
基于javascript实现全国省市二级联动下拉选择菜单
2016/01/28 Javascript
js+css实现回到顶部按钮(back to top)
2016/03/02 Javascript
ExtJS 4.2 Grid组件单元格合并的方法
2016/10/12 Javascript
微信小程序 教程之数据绑定
2016/10/18 Javascript
vue中如何引入jQuery和Bootstrap
2017/04/10 jQuery
Vue学习笔记进阶篇之vue-cli安装及介绍
2017/07/18 Javascript
iview通过Dropdown(下拉菜单)实现的右键菜单
2018/10/26 Javascript
如何手动实现es5中的bind方法详解
2018/12/07 Javascript
其实你可以少写点if else与switch(推荐)
2019/01/10 Javascript
深入学习JavaScript 高阶函数
2019/06/11 Javascript
JavaScript学习教程之cookie与webstorage
2019/06/23 Javascript
用Python生成器实现微线程编程的教程
2015/04/13 Python
在Python中使用成员运算符的示例
2015/05/13 Python
Python单元测试简单示例
2018/07/03 Python
python爬虫之urllib,伪装,超时设置,异常处理的方法
2018/12/19 Python
Python调用C语言程序方法解析
2020/07/07 Python
Python JSON常用编解码方法代码实例
2020/09/05 Python
python各种excel写入方式的速度对比
2020/11/10 Python
python Pexpect模块的使用
2020/12/25 Python
野兽派官方旗舰店:THE BEAST 野兽派
2016/08/05 全球购物
美国东北部户外服装和设备零售商:Eastern Mountain Sports
2016/10/05 全球购物
实习自荐信
2013/10/13 职场文书
网吧消防安全责任书
2014/07/29 职场文书
企业领导班子四风对照检查材料
2014/09/27 职场文书
2014年项目工作总结
2014/11/24 职场文书
web前端之css水平居中代码解析
2021/05/20 HTML / CSS
教你使用VS Code的MySQL扩展管理数据库的方法
2022/01/22 MySQL