编程 Python

python验证码识别教程之利用滴水算法分割图片

Posted in Python onJune 05, 2018

滴水算法概述

滴水算法是一种用于分割手写粘连字符的算法，与以往的直线式地分割不同，它模拟水滴的滚动，通过水滴的滚动路径来分割字符，可以解决直线切割造成的过分分割问题。

引言

之前提过对于有粘连的字符可以使用滴水算法来解决分割，但智商捉急的我实在是领悟不了这个算法的精髓，幸好有小伙伴已经实现相关代码。

我对上面的代码进行了一些小修改，同时升级为python3的代码。

还是以这张图片为例：

python验证码识别教程之利用滴水算法分割图片

在以前的我们已经知道这种简单的粘连可以通过控制阈值来实现分割，这里我们使用滴水算法。

首先使用之前文章中介绍的垂直投影或者连通域先进行一次切割处理，得到结果如下：

python验证码识别教程之利用滴水算法分割图片

针对于最后粘连情况来使用滴水算法处理：

from itertools import groupby

def binarizing(img,threshold):
 """传入image对象进行灰度、二值处理"""
 img = img.convert("L") # 转灰度
 pixdata = img.load()
 w, h = img.size
 # 遍历所有像素，大于阈值的为黑色
 for y in range(h):
  for x in range(w):
   if pixdata[x, y] < threshold:
    pixdata[x, y] = 0
   else:
    pixdata[x, y] = 255
 return img

def vertical(img):
 """传入二值化后的图片进行垂直投影"""
 pixdata = img.load()
 w,h = img.size
 result = []
 for x in range(w):
  black = 0
  for y in range(h):
   if pixdata[x,y] == 0:
    black += 1
  result.append(black)
 return result

def get_start_x(hist_width):
 """根据图片垂直投影的结果来确定起点
  hist_width中间值 前后取4个值 再这范围内取最小值
 """
 mid = len(hist_width) // 2 # 注意py3 除法和py2不同
 temp = hist_width[mid-4:mid+5]
 return mid - 4 + temp.index(min(temp))

def get_nearby_pix_value(img_pix,x,y,j):
 """获取临近5个点像素数据"""
 if j == 1:
  return 0 if img_pix[x-1,y+1] == 0 else 1
 elif j ==2:
  return 0 if img_pix[x,y+1] == 0 else 1
 elif j ==3:
  return 0 if img_pix[x+1,y+1] == 0 else 1
 elif j ==4:
  return 0 if img_pix[x+1,y] == 0 else 1
 elif j ==5:
  return 0 if img_pix[x-1,y] == 0 else 1
 else:
  raise Exception("get_nearby_pix_value error")


def get_end_route(img,start_x,height):
 """获取滴水路径"""
 left_limit = 0
 right_limit = img.size[0] - 1
 end_route = []
 cur_p = (start_x,0)
 last_p = cur_p
 end_route.append(cur_p)

 while cur_p[1] < (height-1):
  sum_n = 0
  max_w = 0
  next_x = cur_p[0]
  next_y = cur_p[1]
  pix_img = img.load()
  for i in range(1,6):
   cur_w = get_nearby_pix_value(pix_img,cur_p[0],cur_p[1],i) * (6-i)
   sum_n += cur_w
   if max_w < cur_w:
    max_w = cur_w
  if sum_n == 0:
   # 如果全黑则看惯性
   max_w = 4
  if sum_n == 15:
   max_w = 6

  if max_w == 1:
   next_x = cur_p[0] - 1
   next_y = cur_p[1]
  elif max_w == 2:
   next_x = cur_p[0] + 1
   next_y = cur_p[1]
  elif max_w == 3:
   next_x = cur_p[0] + 1
   next_y = cur_p[1] + 1
  elif max_w == 5:
   next_x = cur_p[0] - 1
   next_y = cur_p[1] + 1
  elif max_w == 6:
   next_x = cur_p[0]
   next_y = cur_p[1] + 1
  elif max_w == 4:
   if next_x > cur_p[0]:
    # 向右
    next_x = cur_p[0] + 1
    next_y = cur_p[1] + 1
   if next_x < cur_p[0]:
    next_x = cur_p[0]
    next_y = cur_p[1] + 1
   if sum_n == 0:
    next_x = cur_p[0]
    next_y = cur_p[1] + 1
  else:
   raise Exception("get end route error")

  if last_p[0] == next_x and last_p[1] == next_y:
   if next_x < cur_p[0]:
    max_w = 5
    next_x = cur_p[0] + 1
    next_y = cur_p[1] + 1
   else:
    max_w = 3
    next_x = cur_p[0] - 1
    next_y = cur_p[1] + 1
  last_p = cur_p

  if next_x > right_limit:
   next_x = right_limit
   next_y = cur_p[1] + 1
  if next_x < left_limit:
   next_x = left_limit
   next_y = cur_p[1] + 1
  cur_p = (next_x,next_y)
  end_route.append(cur_p)
 return end_route

def get_split_seq(projection_x):
 split_seq = []
 start_x = 0
 length = 0
 for pos_x, val in enumerate(projection_x):
  if val == 0 and length == 0:
   continue
  elif val == 0 and length != 0:
   split_seq.append([start_x, length])
   length = 0
  elif val == 1:
   if length == 0:
    start_x = pos_x
   length += 1
  else:
   raise Exception('generating split sequence occurs error')
 # 循环结束时如果length不为0，说明还有一部分需要append
 if length != 0:
  split_seq.append([start_x, length])
 return split_seq


def do_split(source_image, starts, filter_ends):
 """
 具体实行切割
 : param starts: 每一行的起始点 tuple of list
 : param ends: 每一行的终止点
 """
 left = starts[0][0]
 top = starts[0][1]
 right = filter_ends[0][0]
 bottom = filter_ends[0][1]
 pixdata = source_image.load()
 for i in range(len(starts)):
  left = min(starts[i][0], left)
  top = min(starts[i][1], top)
  right = max(filter_ends[i][0], right)
  bottom = max(filter_ends[i][1], bottom)
 width = right - left + 1
 height = bottom - top + 1
 image = Image.new('RGB', (width, height), (255,255,255))
 for i in range(height):
  start = starts[i]
  end = filter_ends[i]
  for x in range(start[0], end[0]+1):
   if pixdata[x,start[1]] == 0:
    image.putpixel((x - left, start[1] - top), (0,0,0))
 return image

def drop_fall(img):
 """滴水分割"""
 width,height = img.size
 # 1 二值化
 b_img = binarizing(img,200)
 # 2 垂直投影
 hist_width = vertical(b_img)
 # 3 获取起点
 start_x = get_start_x(hist_width)

 # 4 开始滴水算法
 start_route = []
 for y in range(height):
  start_route.append((0,y))

 end_route = get_end_route(img,start_x,height)
 filter_end_route = [max(list(k)) for _,k in groupby(end_route,lambda x:x[1])] # 注意这里groupby
 img1 = do_split(img,start_route,filter_end_route)
 img1.save('cuts-d-1.png')

 start_route = list(map(lambda x : (x[0]+1,x[1]),filter_end_route)) # python3中map不返回list需要自己转换
 end_route = []
 for y in range(height):
  end_route.append((width-1,y))
 img2 = do_split(img,start_route,end_route)
 img2.save('cuts-d-2.png')

if __name__ == '__main__':
 p = Image.open("cuts-2.png")
 drop_fall(p)

执行后会得到切分后的2个照片：

python验证码识别教程之利用滴水算法分割图片

从这张图片来看，虽然切分成功但是效果比较一般。另外目前的代码只能对2个字符粘连的情况切分，参悟了滴水算法精髓的小伙伴可以试着改成多个字符粘连的情况。

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，如果有疑问大家可以留言交流，谢谢大家对三水点靠木的支持。

python验证码识别教程之利用滴水算法分割图片

- Author -

Hi!Roy!

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python使用MySQLdb for Python操作数据库教程

Oct 11 Python

浅谈Python NLP入门教程

Dec 25 Python

Python爬虫——爬取豆瓣电影Top250代码实例

Apr 17 Python

Python PIL图片添加字体的例子

Aug 22 Python

Python如何应用cx_Oracle获取oracle中的clob字段问题

Aug 27 Python

django认证系统实现自定义权限管理的方法

Aug 28 Python

图解python全局变量与局部变量相关知识

Nov 02 Python

Python requests模块session代码实例

Apr 14 Python

python numpy矩阵信息说明,shape,size,dtype

May 22 Python

Python实现中英文全文搜索的示例

Dec 04 Python

Python中npy和mat文件的保存与读取

Apr 24 Python

基于Python实现nc批量转tif格式

Aug 14 Python

django反向解析URL和URL命名空间的方法

Jun 05 #Python

python topN 取最大的N个数或最小的N个数方法

Jun 04 #Python

pytorch + visdom 处理简单分类问题的示例

Jun 04 #Python

numpy中以文本的方式存储以及读取数据方法

Jun 04 #Python

浅谈python中np.array的shape( ,)与( ,1)的区别

Jun 04 #Python

Numpy array数据的增、删、改、查实例

Jun 04 #Python

python实现判断一个字符串是否是合法IP地址的示例

Jun 04 #Python

You might like

PHP strtr() 函数使用说明

2008/11/21 PHP

PHP CURL模拟登录新浪微博抓取页面内容基于EaglePHP框架开发

2012/01/16 PHP

php中通过curl模拟登陆discuz论坛的实现代码

2012/02/16 PHP

php基于mcrypt的加密解密实例

2014/10/27 PHP

NiftyCube——轻松实现圆角边框

2007/02/20 Javascript

JQuery 学习笔记 element属性控制

2009/07/23 Javascript

工作中常用到的JS表单验证代码(包括例子)

2010/11/11 Javascript

jQuery)扩展jQuery系列之一模拟alert，confirm（一）

2010/12/04 Javascript

JS实现随机数生成算法示例代码

2013/08/08 Javascript

js实现的map方法示例代码

2014/01/13 Javascript

javascript向后台传送相同属性的参数即数组参数

2014/02/17 Javascript

javascript将相对路径转绝对路径示例

2014/03/14 Javascript

js实现3D图片逐张轮播幻灯片特效代码分享

2015/09/09 Javascript

一个简单的JavaScript Map实例(分享)

2016/08/03 Javascript

更靠谱的H5横竖屏检测方法（js代码）

2016/09/13 Javascript

vue 项目中使用Loading组件的示例代码

2018/08/31 Javascript

vue 2.8.2版本配置刚进入时候的默认页面方法

2018/09/21 Javascript

学习使用ExpressJS 4.0中的新Router的用法

2018/11/06 Javascript

简单实现vue中的依赖收集与响应的方法

2019/02/18 Javascript

小程序自定义导航栏兼容适配所有机型（附完整案例）

2020/04/26 Javascript

javascript实现支付宝滑块验证码效果

2020/07/24 Javascript

javascript实现图片轮换动作方法

2020/08/07 Javascript

解决vue props传Array/Object类型值,子组件报错的情况

2020/11/07 Javascript

使用python的chardet库获得文件编码并修改编码

2014/01/22 Python

selenium+python实现1688网站验证码图片的截取功能

2018/08/14 Python

PyQt4实时显示文本内容GUI的示例

2019/06/14 Python

Django接收自定义http header过程详解

2019/08/23 Python

关于多种方式完美解决Python pip命令下载第三方库的问题

2020/12/21 Python

JD Sports荷兰：英国领先的运动时尚零售商

2020/03/13 全球购物

大学生毕业自我评价范文分享

2013/11/07 职场文书

班会关于环保演讲稿

2013/12/29 职场文书

介绍长城的导游词

2015/01/30 职场文书

员工辞职信怎么写

2015/02/27 职场文书

导游词之烟台威海蓬莱

2019/11/14 职场文书

python如何利用traceback获取详细的异常信息

2021/06/05 Python

利用Python脚本写端口扫描器socket,python-nmap

2022/07/23 Python