python数据处理 根据颜色对图片进行分类的方法


Posted in Python onDecember 08, 2018

前面一篇文章有说过,利用scrapy来爬取图片,是为了对图片数据进行分类而收集数据。

本篇文章就是利用上次爬取的图片数据,根据图片的颜色特征来做一个简单的分类处理。

实现步骤如下:

1:图片路径添加

2:对比度处理

3:滤波处理

4:数据提取以及特征向量化

5:图片分类处理

6:根据处理结果将图片分类保存

代码量中等,还可以更少,只是我为了练习类的使用,而将每个步骤都封装成了一个独立的类,当然里面也有类继承的问题,遇到的问题前面一篇文章有讲解。内容可能有点繁琐,尤其是文件和路径的使用(可以自己修改),已经尽量优化代码了。

爬取的原始数据如下:

python数据处理 根据颜色对图片进行分类的方法

直接上代码:

import os
import numpy as np
import skimage
import matplotlib.pyplot as plt
from skimage import io 				#读取图片
from skimage import exposure		#调用调对比度的方法	rescale_intensity、equalize_hist
from skimage.filters import gaussian	#高斯
from skimage import img_as_float  #图片unit8类型到float
from scipy.cluster.vq import kmeans,vq,whiten  #聚类算法
import shutil	#文件夹内容删除
 
class Path(object):
	def __init__(self):
		self.path = r"D:\PYscrapy\get_lixiaoran\picture"
		self.pathlist = []	#原始图片列表
		self.page = 0
 
	def append(self):					#将每张图片的路径加载到列表中
		much = os.listdir(self.path)
		for i in range(len(much)):
			repath = os.path.join(self.path,str(self.page)+'.jpg')
			self.page +=1
			self.pathlist.append(repath)
		return self.pathlist
 
class Contrast(object):
	def __init__(self,pathlist):
		self.pathlist = pathlist
		self.contrastlist = []	#改变对比度之后的图片列表
		self.path2 = r"D:\PYscrapy\get_lixiaoran\picture2"
		self.page2 = 0
 
	def balance(self):			#将每张图片进行对比度的处理,两种方式 1:均衡化 2:从某个值开始取极值
		if os.path.exists(self.path2) == False:
			os.mkdir(self.path2)
 
		# for lis in self.pathlist:
		# 	data = skimage.io.imread(lis)
		# 	equalized = exposure.equalize_hist(data)	#方法一这里使用个人人为更好的均衡化处理对比度的方法
		# 	self.contrastlist.append(equalized)
 
		for lis in self.pathlist:
			data = skimage.io.imread(lis)
			high_contrast = exposure.rescale_intensity(data,in_range=(20,220))	#方法二 以20和220取两端极值
			self.contrastlist.append(high_contrast)
 
		for img in self.contrastlist:
			repath = os.path.join(self.path2,str(self.page2)+'.jpg')		#保存修改后的图片
			skimage.io.imsave(repath,img)
			self.page2 +=1
 
class Filter(Contrast):
	def __init__(self,pathlist):
		super().__init__(pathlist)
		self.path31 = self.path2
		self.path32 = r"D:\PYscrapy\get_lixiaoran\picture3"
		self.page3 = 0
		self.filterlist = []
 
	def filte_r(self):
		img = os.listdir(self.path31)	#读取文件内容
		if os.path.exists(self.path32) == False:
			os.mkdir(self.path32)
		for lis in range(len(img)):			#循环做每张图片的高斯过滤
			path = os.path.join(self.path31,str(lis)+r'.jpg')
			img = skimage.io.imread(path)
			gas = gaussian(img,sigma=3)		#multichannel=False	去掉颜色2D
			self.filterlist.append(gas)
			path_gas = os.path.join(self.path32,str(self.page3)+r'.jpg')
			skimage.io.imsave(path_gas,gas)
			self.page3 +=1
		return self.path32
 
class Vectoring(object):
	def __init__(self,filter_path):
		self.path41 = filter_path
		self.diff = []
		self.calculate = []
 
	def vector(self):
		numbers = os.listdir(self.path41)	#获取文件夹内容
		os.chdir(self.path41)		#切换路径
		for i in range(len(numbers)):
			self.diff.append([])
			for j in range(4):
				self.diff[i].append([])		#diff[[number],[img_float],[bin_centers],[hist]]
 
		for cnt,number in enumerate(numbers):
			img_float = img_as_float(skimage.io.imread(number))		#将图像ndarry nint8->float
			hist,bin_centers = exposure.histogram(img_float,nbins=10)	#取图像的	每个区间的像素值	分隔区间
			self.diff[cnt][0] = number
			self.diff[cnt][1] = img_float
			self.diff[cnt][2] = bin_centers	#把数据添加到diff中
			self.diff[cnt][3] = hist
 
		for i,j in enumerate(self.diff):		#使用hist和bin_centers相乘来降维,向量化
			self.calculate.append([y*self.diff[i][3][x] for x,y in enumerate(self.diff[i][2])])	#这里可能需要理解一下,就是涉及的参数有点多
		for i in range(len(self.diff)):
			self.diff[i].append(self.calculate[i])	#将特征向量calculate也加入到diff中
 
		return self.diff 			#diff[[number],[img_float],[bin_centers],[hist],[calculate]]
 
class Modeling(Vectoring):
	def __init__(self,filter_path,K):
		super().__init__(filter_path)
		self.K = K
 
	def model(self):
		diff = self.vector()
		calculate = []
		for i in range(len(diff)):
			calculate.append(diff[i][4])
		spot = whiten(calculate)			#这里使用scipy的k-means方法来对图片进行分类
		center,_ = kmeans(spot,self.K)		#如果对scipy的k-means不熟悉,前面有专门的讲解
		cluster,_ = vq(spot,center)
		return diff,cluster 	#获得预测值
		
class Predicting(object):
	def __init__(self,predicted_diff,predicted_cluster,K):
		self.diff = predicted_diff
		self.cluster = predicted_cluster
		self.path42 = r'D:\PYscrapy\get_lixiaoran\picture4'
		self.K = K
 
	def predicted(self):
		if os.path.exists(self.path42) == True:
			much = shutil.rmtree(self.path42)
			os.mkdir(self.path42)
		else:
			os.mkdir(self.path42)
		os.chdir(self.path42)
		for i in range(self.K):			#创建K个文件夹
			os.mkdir('classify{}'.format(i))
		for i,j in enumerate(self.cluster):
			skimage.io.imsave('classify{}\\{}'.format(j,self.diff[i][0]),self.diff[i][1])	#根据图片的分类来将它们保存至对应的文件夹
 
if __name__=="__main__":
	np.random.seed(10)
	#文件路径添加
	start = Path()
	pathlist = start.append()
 
	#对比度类
	second = Contrast(pathlist)
	second.balance()	#get改变对比度后的图片个数
 
	#高斯过滤
	filte = Filter(pathlist)
	filter_path = filte.filte_r()
 
	#数据提取及向量化
	vectoring = Vectoring(filter_path)
 
	#K值的自定义
	K = 3
 
	#建模
	modeling = Modeling(filter_path,K)
	predicted_diff,predicted_cluster = modeling.model()
 
	#预测
	predicted = Predicting(predicted_diff,predicted_cluster,K)
	predicted.predicted()

文件如下:

python数据处理 根据颜色对图片进行分类的方法

(K=3)分类如下(picrure4):

python数据处理 根据颜色对图片进行分类的方法

python数据处理 根据颜色对图片进行分类的方法

白色的基本在一类

python数据处理 根据颜色对图片进行分类的方法

黑色的基本一类

分类出来的图片比较模糊是因为,我分类的是处理过后的图片,并非原图。

其实仔细看效果还是有的,就是确实不是太明显,图片的内容还是有点复杂的。大体的框架已经有了,只是优化的问题,调整优化,以及向量特征化的处理,就能得到更好的结果。或者使用一些更好的处理方式,我这里只是简单的使用了几种常见的图片处理方式,所以效果一般。

这里的类有点多,从上到下是类的顺序,所以一步步看还是不复杂的。如果有什么好的建议可以分享一下。

以上这篇python数据处理 根据颜色对图片进行分类的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python语言编写电脑时间自动同步小工具
Mar 08 Python
python使用点操作符访问字典(dict)数据的方法
Mar 16 Python
Python的Bottle框架中获取制定cookie的教程
Apr 24 Python
python读写二进制文件的方法
May 09 Python
Python 12306抢火车票脚本
Feb 07 Python
谈谈python中GUI的选择
Mar 01 Python
python 实现敏感词过滤的方法
Jan 21 Python
python基础梳理(一)(推荐)
Apr 06 Python
Django模型修改及数据迁移实现解析
Aug 01 Python
在OpenCV里使用Camshift算法的实现
Nov 22 Python
python安装读取grib库总结(推荐)
Jun 24 Python
PyCharm2020最新激活码+激活码补丁(亲测最新版PyCharm2020.2激活成功)
Nov 25 Python
Python发送邮件测试报告操作实例详解
Dec 08 #Python
Python自动发送邮件的方法实例总结
Dec 08 #Python
Python数据集切分实例
Dec 08 #Python
python分批定量读取文件内容,输出到不同文件中的方法
Dec 08 #Python
对python遍历文件夹中的所有jpg文件的实例详解
Dec 08 #Python
pandas求两个表格不相交的集合方法
Dec 08 #Python
对pytorch网络层结构的数组化详解
Dec 08 #Python
You might like
php Mysql日期和时间函数集合
2007/11/16 PHP
php多层数组与对象的转换实例代码
2013/08/05 PHP
PHP加密函数 Javascript/Js 解密函数
2013/09/23 PHP
php-perl哈希算法实现(times33哈希算法)
2013/12/30 PHP
VB中的RasEnumConnections函数返回632错误解决方法
2014/07/29 PHP
学习php设计模式 php实现单例模式(singleton)
2015/12/07 PHP
PHP带节点操作的无限分类实现方法详解
2016/11/09 PHP
php分享朋友圈的实现代码
2019/02/18 PHP
PHP+Apache实现二级域名之间共享cookie的方法
2019/07/24 PHP
搭建PhpStorm+PhpStudy开发环境的超详细教程
2020/09/17 PHP
jquery ajax 登录验证实现代码
2009/09/23 Javascript
JS中的log对象获取以及debug的写法介绍
2014/03/03 Javascript
jquery实现select选中行、列合计示例
2014/04/25 Javascript
bootstrap输入框组代码分享
2016/06/07 Javascript
Vue.js学习记录之在元素与template中使用v-if指令实例
2017/06/27 Javascript
EasyUI的TreeGrid的过滤功能的解决思路
2017/08/08 Javascript
关于redux-saga中take使用方法详解
2018/02/27 Javascript
vue采用EventBus实现跨组件通信及注意事项小结
2018/06/14 Javascript
vue路由前进后退动画效果的实现代码
2018/12/10 Javascript
微信小程序利用swiper+css实现购物车商品删除功能
2019/03/06 Javascript
mui js控制开关状态、修改switch开关的值方法
2019/09/03 Javascript
JavaScript经典案例之简易计算器
2020/08/24 Javascript
用python结合jieba和wordcloud实现词云效果
2017/09/05 Python
Python设计模式之迭代器模式原理与用法实例分析
2019/01/10 Python
Python3 串口接收与发送16进制数据包的实例
2019/06/12 Python
详解一种用django_cache实现分布式锁的方式
2019/09/01 Python
python全局变量引用与修改过程解析
2020/01/07 Python
Python中实现一行拆多行和多行并一行的示例代码
2020/09/06 Python
法国一家芭蕾舞鞋公司:Repetto
2018/11/12 全球购物
戴森香港官方网站:Dyson香港
2021/02/11 全球购物
Ajxa常见问题都有哪些
2014/03/26 面试题
网络研修随笔感言
2014/02/17 职场文书
小学家长通知书评语
2014/12/31 职场文书
爱牙日宣传活动总结
2015/02/05 职场文书
律政俏佳人观后感
2015/06/09 职场文书
python spilt()分隔字符串的实现示例
2021/05/21 Python