python使用KNN算法手写体识别


Posted in Python onFebruary 01, 2018

本文实例为大家分享了用KNN算法手写体识别的具体代码,供大家参考,具体内容如下

#!/usr/bin/python 
#coding:utf-8 
 
import numpy as np 
import operator 
import matplotlib 
import matplotlib.pyplot as plt 
import os 
 
''''' 
KNN算法 
1. 计算已知类别数据集中的每个点依次执行与当前点的距离。 
2. 按照距离递增排序。 
3. 选取与当前点距离最小的k个点 
4. 确定前k个点所在类别的出现频率 
5. 返回前k个点出现频率最高的类别作为当前点的预测分类 
''' 
 
''''' 
inX为要分类的向量 
dataSet为训练样本 
labels为标签向量 
k为最近邻的个数 
''' 
def classify0(inX , dataSet , labels , k): 
 dataSetSize = dataSet.shape[0]#dataSetSize为训练样本的个数 
 diffMat = np.tile(inX , (dataSetSize , 1)) - dataSet#将inX扩展为dataSetSize行,1列 
 sqDiffMat = diffMat**2 
 sqDistances = sqDiffMat.sum(axis=1) 
 distances = sqDistances**0.5 
 sortedDistIndicies = distances.argsort()#返回的是元素从小到大排序后,该元素原来的索引值的序列 
 classCount = {} 
 for i in range(k): 
  voteIlabel = labels[sortedDistIndicies[i]]#voteIlabel为类别 
  classCount[voteIlabel] = classCount.get(voteIlabel,0)+1#如果之前这个voteIlabel是有的,那么就返回字典里这个voteIlabel里的值,如果没有就返回0 
 sortedClassCount = sorted(classCount.iteritems(),key=operator.itemgetter(1),reverse=True)#key=operator.itemgetter(1)的意思是按照字典里的第一个排序,{A:1,B:2},要按照第1个(AB是第0个),即‘1'‘2'排序。reverse=True是降序排序 
 print sortedClassCount 
 return sortedClassCount[0][0] 
 
 
''''' 
将图像转换为1*1024的向量 
''' 
def img2vector(filename): 
 returnVect = np.zeros((1,1024)) 
 fr = open(filename) 
 for i in range(32): 
  line = fr.readline() 
  for j in range(32): 
   returnVect[0,i*32+j] = int(line[j] ) 
 return returnVect 
 
''''' 
手写体识别系统测试 
''' 
def handwritingClassTest(trainFilePath,testFilePath): 
 hwLabels = [] 
 trainingFileList = os.listdir(trainFilePath) 
 m=len(trainingFileList) 
 trainSet = np.zeros((m,1024)) 
 for i in range(m): 
  filename = trainingFileList[i] 
  classNum = filename.split('.')[0] 
  classNum = int(classNum.split('_')[0]) 
  hwLabels.append(classNum) 
  trainSet[i] = img2vector( os.path.join(trainFilePath,filename) ) 
 testFileList = os.listdir(testFilePath) 
 errorCount = 0 
 mTest = len(testFileList) 
 for i in range(mTest): 
  filename = trainingFileList[i] 
  classNum = filename.split('.')[0] 
  classNum = int(classNum.split('_')[0]) 
  vectorUnderTest = img2vector(os.path.join(trainFilePath, filename)) 
  classifyNum = classify0(vectorUnderTest,trainSet,hwLabels,10) 
  print "the classifier came back with : %d , the real answer is : %d"% (classifyNum , classNum) 
  if(classifyNum != classNum) : errorCount+=1 
 print ("\nthe total number of error is : %d"%errorCount) 
 print ("\nthe error rate is : %f"%(float(errorCount)/mTest)) 
handwritingClassTest()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Flask的图形化管理界面搭建框架Flask-Admin的使用教程
Jun 13 Python
Python2.7基于淘宝接口获取IP地址所在地理位置的方法【测试可用】
Jun 07 Python
Python用于学习重要算法的模块pygorithm实例浅析
Aug 16 Python
python中cPickle类使用方法详解
Aug 27 Python
浅谈pycharm出现卡顿的解决方法
Dec 03 Python
python实现五子棋小游戏
Mar 25 Python
pyinstaller打包多个py文件和去除cmd黑框的方法
Jun 21 Python
python中 * 的用法详解
Jul 10 Python
使用Python自动生成HTML的方法示例
Aug 06 Python
Atom Python 配置Python3 解释器的方法
Aug 28 Python
tensorflow中的数据类型dtype用法说明
May 26 Python
Python万能模板案例之matplotlib绘制甘特图
Apr 13 Python
python @property的用法及含义全面解析
Feb 01 #Python
详解Tensorflow数据读取有三种方式(next_batch)
Feb 01 #Python
Python3 XML 获取雅虎天气的实现方法
Feb 01 #Python
Python命令行解析模块详解
Feb 01 #Python
python2.7到3.x迁移指南
Feb 01 #Python
Python Paramiko模块的使用实际案例
Feb 01 #Python
python中使用xlrd读excel使用xlwt写excel的实例代码
Jan 31 #Python
You might like
PHP采集利器 Snoopy 试用心得
2011/07/03 PHP
解析PHP自带的进位制之间的转换函数
2013/06/08 PHP
PHP输入输出流学习笔记
2015/05/12 PHP
Yii2简单实现多语言配置的方法
2016/07/23 PHP
利用PHP访问MySql数据库的逻辑操作以及增删改查的实例讲解
2017/08/30 PHP
PHP基于面向对象封装的分页类示例
2019/03/15 PHP
Js 获取当前日期时间及其它操作实现代码
2021/03/04 Javascript
jquery ajax请求实例深入解析
2012/11/26 Javascript
file模式访问网页时iframe高度自适应解决方案
2013/01/16 Javascript
jquery实现弹出层遮罩效果的简单实例
2014/03/03 Javascript
JavaScript实现的CRC32函数示例
2016/11/23 Javascript
微信小程序 配置文件详细介绍
2016/12/14 Javascript
vue项目中的webpack-dev-sever配置方法
2017/12/14 Javascript
layui 对弹窗 form表单赋值的实现方法
2019/09/04 Javascript
d3.js 地铁轨道交通项目实战
2019/11/27 Javascript
ESLint 是如何检查 .vue 文件的
2020/11/30 Vue.js
[06:24]DOTA2亚洲邀请赛小组赛第三日 TOP10精彩集锦
2015/02/01 DOTA
[47:08]OG vs INfamous 2019国际邀请赛小组赛 BO2 第一场 8.15
2019/08/17 DOTA
[52:20]DOTA2-DPC中国联赛正赛 SAG vs XGBO3 第一场 3月5日
2021/03/11 DOTA
讲解Python中fileno()方法的使用
2015/05/24 Python
对Python中range()函数和list的比较
2018/04/19 Python
django+mysql的使用示例
2018/11/23 Python
python数据归一化及三种方法详解
2019/08/06 Python
python批量图片处理简单示例
2019/08/06 Python
详解python中*号的用法
2019/10/21 Python
django 数据库返回queryset实现封装为字典
2020/05/19 Python
CSS改变网页中鼠标选中文字背景颜色例子
2014/04/23 HTML / CSS
Java的基础面试题附答案
2016/01/10 面试题
国际贸易专业个人求职信范文分享
2013/12/14 职场文书
建筑文秘专业个人求职信范文
2013/12/28 职场文书
运动会入场词50字
2014/02/20 职场文书
医学专业毕业生推荐信
2014/07/12 职场文书
小学语文教师研修日志
2015/11/13 职场文书
python 算法题——快乐数的多种解法
2021/05/27 Python
python b站视频下载的五种版本
2021/05/27 Python
Hive HQL支持2种查询语句风格
2022/06/25 数据库