编程 Python

Python+opencv 实现图片文字的分割的方法示例

Posted in Python onJuly 04, 2019

实现步骤：

1、通过水平投影对图形进行水平分割，获取每一行的图像；

2、通过垂直投影对分割的每一行图像进行垂直分割，最终确定每一个字符的坐标位置，分割出每一个字符；

先简单介绍一下投影法：分别在水平和垂直方向对预处理（二值化）的图像某一种像素进行统计，对于二值化图像非黑即白，我们通过对其中的白点或者黑点进行统计，根据统计结果就可以判断出每一行的上下边界以及每一列的左右边界，从而实现分割的目的。

下面通过Python+opencv来实现该功能

首先来实现水平投影：

import cv2

import numpy as np

 

'''水平投影'''

def getHProjection(image):

 hProjection = np.zeros(image.shape,np.uint8)

 #图像高与宽

 (h,w)=image.shape 

 #长度与图像高度一致的数组

 h_ = [0]*h

 #循环统计每一行白色像素的个数

 for y in range(h):

  for x in range(w):

   if image[y,x] == 255:

    h_[y]+=1

 #绘制水平投影图像

 for y in range(h):

  for x in range(h_[y]):

   hProjection[y,x] = 255

 cv2.imshow('hProjection2',hProjection)

 

 return h_

 

if __name__ == "__main__":

 #读入原始图像

 origineImage = cv2.imread('test.jpg')

 # 图像灰度化 

 #image = cv2.imread('test.jpg',0)

 image = cv2.cvtColor(origineImage,cv2.COLOR_BGR2GRAY)

 cv2.imshow('gray',image)

 # 将图片二值化

 retval, img = cv2.threshold(image,127,255,cv2.THRESH_BINARY_INV)

 cv2.imshow('binary',img)

 #水平投影

 H = getHProjection(img)

Python+opencv 实现图片文字的分割的方法示例

通过上面的水平投影，根据其白色小山峰的起始位置就可以界定出每一行的起始位置，从而把每一行分割出来。

Python+opencv 实现图片文字的分割的方法示例

获得每一行图像之后，可以对其进行垂直投影

def getVProjection(image):

 vProjection = np.zeros(image.shape,np.uint8);

 #图像高与宽

 (h,w) = image.shape

 #长度与图像宽度一致的数组

 w_ = [0]*w

 #循环统计每一列白色像素的个数

 for x in range(w):

  for y in range(h):

   if image[y,x] == 255:

    w_[x]+=1

 #绘制垂直平投影图像

 for x in range(w):

  for y in range(h-w_[x],h):

   vProjection[y,x] = 255

 cv2.imshow('vProjection',vProjection)

 return w_

Python+opencv 实现图片文字的分割的方法示例

通过垂直投影可以获得每一个字符左右的起始位置，这样也就可以获得到每一个字符的具体坐标位置，即一个矩形框的位置。

下面是实现的全部代码：

import cv2

import numpy as np

 

'''水平投影'''

def getHProjection(image):

 hProjection = np.zeros(image.shape,np.uint8)

 #图像高与宽

 (h,w)=image.shape 

 #长度与图像高度一致的数组

 h_ = [0]*h

 #循环统计每一行白色像素的个数

 for y in range(h):

  for x in range(w):

   if image[y,x] == 255:

    h_[y]+=1

 #绘制水平投影图像

 for y in range(h):

  for x in range(h_[y]):

   hProjection[y,x] = 255

 cv2.imshow('hProjection2',hProjection)

 

 return h_

 

def getVProjection(image):

 vProjection = np.zeros(image.shape,np.uint8);

 #图像高与宽

 (h,w) = image.shape

 #长度与图像宽度一致的数组

 w_ = [0]*w

 #循环统计每一列白色像素的个数

 for x in range(w):

  for y in range(h):

   if image[y,x] == 255:

    w_[x]+=1

 #绘制垂直平投影图像

 for x in range(w):

  for y in range(h-w_[x],h):

   vProjection[y,x] = 255

 #cv2.imshow('vProjection',vProjection)

 return w_

 

if __name__ == "__main__":

 #读入原始图像

 origineImage = cv2.imread('test.jpg')

 # 图像灰度化 

 #image = cv2.imread('test.jpg',0)

 image = cv2.cvtColor(origineImage,cv2.COLOR_BGR2GRAY)

 cv2.imshow('gray',image)

 # 将图片二值化

 retval, img = cv2.threshold(image,127,255,cv2.THRESH_BINARY_INV)

 cv2.imshow('binary',img)

 #图像高与宽

 (h,w)=img.shape 

 Position = []

 #水平投影

 H = getHProjection(img)

 

 start = 0

 H_Start = []

 H_End = []

 #根据水平投影获取垂直分割位置

 for i in range(len(H)):

  if H[i] > 0 and start ==0:

   H_Start.append(i)

   start = 1

  if H[i] <= 0 and start == 1:

   H_End.append(i)

   start = 0

 #分割行，分割之后再进行列分割并保存分割位置

 for i in range(len(H_Start)):

  #获取行图像

  cropImg = img[H_Start[i]:H_End[i], 0:w]

  #cv2.imshow('cropImg',cropImg)

  #对行图像进行垂直投影

  W = getVProjection(cropImg)

  Wstart = 0

  Wend = 0

  W_Start = 0

  W_End = 0

  for j in range(len(W)):

   if W[j] > 0 and Wstart ==0:

    W_Start =j

    Wstart = 1

    Wend=0

   if W[j] <= 0 and Wstart == 1:

    W_End =j

    Wstart = 0

    Wend=1

   if Wend == 1:

    Position.append([W_Start,H_Start[i],W_End,H_End[i]])

    Wend =0

 #根据确定的位置分割字符

 for m in range(len(Position)):

  cv2.rectangle(origineImage, (Position[m][0],Position[m][1]), (Position[m][2],Position[m][3]), (0 ,229 ,238), 1)

 cv2.imshow('image',origineImage)

 cv2.waitKey(0)

Python+opencv 实现图片文字的分割的方法示例

从分割的结果上看，基本上实现了图片中文字的分割。但由于中文结构复杂性，对于一些文字的分割并不理想，比如“叶”、“桃”等字会出现过度分割现象；对于有粘连的两个字会出现分割不够的现象，比如上图中的“念想”。不过可以从图像预处理（腐蚀），边界判断阈值的调整等方面进行优化。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持三水点靠木。

Python+opencv 实现图片文字的分割的方法示例

- Author -

坏小孩90

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python每次处理固定个数的字符的方法总结

Jan 29 Python

python网络编程示例(客户端与服务端)

Apr 24 Python

Python选择排序、冒泡排序、合并排序代码实例

Apr 10 Python

详解 Python中LEGB和闭包及装饰器

Aug 03 Python

解决出现Incorrect integer value: '' for column 'id' at row 1的问题

Oct 29 Python

用python做游戏的细节详解

Jun 25 Python

Python基于内置库pytesseract实现图片验证码识别功能

Feb 24 Python

Django REST Swagger实现指定api参数

Jul 07 Python

10行Python代码实现Web自动化管控的示例代码

Aug 14 Python

Python通过getattr函数获取对象的属性值

Oct 16 Python

Python经典五人分鱼实例讲解

Jan 04 Python

python实现ROA算子边缘检测算法

Apr 05 Python

pandas 使用均值填充缺失值列的小技巧分享

Jul 04 #Python

Python使用sklearn库实现的各种分类算法简单应用小结

Jul 04 #Python

python3.x+pyqt5实现主窗口状态栏里（嵌入）显示进度条功能

Jul 04 #Python

pandas取出重复数据的方法

Jul 04 #Python

Python使用sklearn实现的各种回归算法示例

Jul 04 #Python

python SQLAlchemy的Mapping与Declarative详解

Jul 04 #Python

pandas分区间,算频率的实例

Jul 04 #Python

You might like

php 生成WML页面方法详解

2009/08/09 PHP

Javascript this指针

2009/07/30 Javascript

JavaScript 函数调用规则

2009/09/14 Javascript

jquery实现漂浮在网页右侧的qq在线客服插件示例

2013/05/13 Javascript

JS清除IE浏览器缓存的方法

2013/07/26 Javascript

可恶的ie8提示缺少id未定义

2014/03/20 Javascript

Jquery 获取指定标签的对象及属性的设置与移除

2014/05/29 Javascript

图片放大镜jquery.jqzoom.js使用实例附放大镜图标

2014/06/19 Javascript

关于微信上网页图片点击全屏放大效果

2016/12/19 Javascript

JS定时器用法分析【时钟与菜单中的应用】

2016/12/21 Javascript

js实现贪吃蛇小游戏（容易理解）

2017/01/22 Javascript

javascript 中null和undefined区分和比较

2017/04/19 Javascript

基于javascript中的typeof和类型判断(详解)

2017/10/27 Javascript

vue中阻止click事件冒泡,防止触发另一个事件的方法

2018/02/08 Javascript

layui table 参数设置方法

2018/08/14 Javascript

js中实例与对象的区别讲解

2019/01/21 Javascript

[57:31]DOTA2-DPC中国联赛正赛 SAG vs CDEC BO3 第一场 2月1日

2021/03/11 DOTA

Python实现检测服务器是否可以ping通的2种方法

2015/01/01 Python

Python统计文件中去重后uuid个数的方法

2015/07/30 Python

实时获取Python的print输出流方法

2019/01/07 Python

详解pandas删除缺失数据(pd.dropna()方法)

2019/06/25 Python

33个Python爬虫项目实战(推荐)

2019/07/08 Python

Python中新式类与经典类的区别详析

2019/07/10 Python

python实现读取excel文件中所有sheet操作示例

2019/08/09 Python

Numpy的简单用法小结

2019/08/28 Python

印度最好的在线药品订购网站：PharmEasy

2018/11/30 全球购物

Juice Beauty官网：有机美容产品，护肤与化妆品

2020/06/13 全球购物

党员干部批评与自我批评反四风思想汇报

2014/09/21 职场文书

学校纪律作风整改措施思想汇报

2014/10/11 职场文书

2014年超市工作总结

2014/11/19 职场文书

学生考试舞弊检讨书

2015/01/01 职场文书

2016年公司新年寄语

2015/08/17 职场文书

2016学校元旦晚会经典开场白台词

2015/12/03 职场文书

护士爱岗敬业心得体会

2016/01/25 职场文书

2019年家电促销广告语集锦

2019/10/21 职场文书

react 路由Link配置详解

2021/11/11 Javascript