python使用tensorflow深度学习识别验证码


Posted in Python onApril 03, 2018

本文介绍了python使用tensorflow深度学习识别验证码 ,分享给大家,具体如下:

除了传统的PIL包处理图片,然后用pytessert+OCR识别意外,还可以使用tessorflow训练来识别验证码。

此篇代码大部分是转载的,只改了很少地方。

代码是运行在linux环境,tessorflow没有支持windows的python 2.7。

gen_captcha.py代码。

#coding=utf-8
from captcha.image import ImageCaptcha # pip install captcha
import numpy as np
import matplotlib.pyplot as plt
from PIL import Image
import random

# 验证码中的字符, 就不用汉字了

number = ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9']
alphabet = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u',
      'v', 'w', 'x', 'y', 'z']

ALPHABET = ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U',
      'V', 'W', 'X', 'Y', 'Z']
'''
number=['0','1','2','3','4','5','6','7','8','9']
alphabet =[]
ALPHABET =[]
'''

# 验证码一般都无视大小写;验证码长度4个字符
def random_captcha_text(char_set=number + alphabet + ALPHABET, captcha_size=4):
  captcha_text = []
  for i in range(captcha_size):
    c = random.choice(char_set)
    captcha_text.append(c)
  return captcha_text


# 生成字符对应的验证码
def gen_captcha_text_and_image():
  while(1):
    image = ImageCaptcha()

    captcha_text = random_captcha_text()
    captcha_text = ''.join(captcha_text)

    captcha = image.generate(captcha_text)
    #image.write(captcha_text, captcha_text + '.jpg') # 写到文件

    captcha_image = Image.open(captcha)
    #captcha_image.show()
    captcha_image = np.array(captcha_image)
    if captcha_image.shape==(60,160,3):
      break

  return captcha_text, captcha_image






if __name__ == '__main__':
  # 测试
  text, image = gen_captcha_text_and_image()
  print image
  gray = np.mean(image, -1)
  print gray

  print image.shape
  print gray.shape
  f = plt.figure()
  ax = f.add_subplot(111)
  ax.text(0.1, 0.9, text, ha='center', va='center', transform=ax.transAxes)
  plt.imshow(image)

  plt.show()

train.py代码。

#coding=utf-8
from gen_captcha import gen_captcha_text_and_image
from gen_captcha import number
from gen_captcha import alphabet
from gen_captcha import ALPHABET

import numpy as np
import tensorflow as tf

"""
text, image = gen_captcha_text_and_image()
print "验证码图像channel:", image.shape # (60, 160, 3)
# 图像大小
IMAGE_HEIGHT = 60
IMAGE_WIDTH = 160
MAX_CAPTCHA = len(text)
print  "验证码文本最长字符数", MAX_CAPTCHA # 验证码最长4字符; 我全部固定为4,可以不固定. 如果验证码长度小于4,用'_'补齐
"""
IMAGE_HEIGHT = 60
IMAGE_WIDTH = 160
MAX_CAPTCHA = 4

# 把彩色图像转为灰度图像(色彩对识别验证码没有什么用)
def convert2gray(img):
  if len(img.shape) > 2:
    gray = np.mean(img, -1)
    # 上面的转法较快,正规转法如下
    # r, g, b = img[:,:,0], img[:,:,1], img[:,:,2]
    # gray = 0.2989 * r + 0.5870 * g + 0.1140 * b
    return gray
  else:
    return img


"""
cnn在图像大小是2的倍数时性能最高, 如果你用的图像大小不是2的倍数,可以在图像边缘补无用像素。
np.pad(image,((2,3),(2,2)), 'constant', constant_values=(255,)) # 在图像上补2行,下补3行,左补2行,右补2行
"""

# 文本转向量
char_set = number + alphabet + ALPHABET + ['_'] # 如果验证码长度小于4, '_'用来补齐
CHAR_SET_LEN = len(char_set)


def text2vec(text):
  text_len = len(text)
  if text_len > MAX_CAPTCHA:
    raise ValueError('验证码最长4个字符')

  vector = np.zeros(MAX_CAPTCHA * CHAR_SET_LEN)

  def char2pos(c):
    if c == '_':
      k = 62
      return k
    k = ord(c) - 48
    if k > 9:
      k = ord(c) - 55
      if k > 35:
        k = ord(c) - 61
        if k > 61:
          raise ValueError('No Map')
    return k

  for i, c in enumerate(text):
    #print text
    idx = i * CHAR_SET_LEN + char2pos(c)
    #print i,CHAR_SET_LEN,char2pos(c),idx
    vector[idx] = 1
  return vector

#print text2vec('1aZ_')

# 向量转回文本
def vec2text(vec):
  char_pos = vec.nonzero()[0]
  text = []
  for i, c in enumerate(char_pos):
    char_at_pos = i # c/63
    char_idx = c % CHAR_SET_LEN
    if char_idx < 10:
      char_code = char_idx + ord('0')
    elif char_idx < 36:
      char_code = char_idx - 10 + ord('A')
    elif char_idx < 62:
      char_code = char_idx - 36 + ord('a')
    elif char_idx == 62:
      char_code = ord('_')
    else:
      raise ValueError('error')
    text.append(chr(char_code))
  return "".join(text)


"""
#向量(大小MAX_CAPTCHA*CHAR_SET_LEN)用0,1编码 每63个编码一个字符,这样顺利有,字符也有
vec = text2vec("F5Sd")
text = vec2text(vec)
print(text) # F5Sd
vec = text2vec("SFd5")
text = vec2text(vec)
print(text) # SFd5
"""


# 生成一个训练batch
def get_next_batch(batch_size=128):
  batch_x = np.zeros([batch_size, IMAGE_HEIGHT * IMAGE_WIDTH])
  batch_y = np.zeros([batch_size, MAX_CAPTCHA * CHAR_SET_LEN])

  # 有时生成图像大小不是(60, 160, 3)
  def wrap_gen_captcha_text_and_image():
    while True:
      text, image = gen_captcha_text_and_image()
      if image.shape == (60, 160, 3):
        return text, image

  for i in range(batch_size):
    text, image = wrap_gen_captcha_text_and_image()
    image = convert2gray(image)

    batch_x[i, :] = image.flatten() / 255 # (image.flatten()-128)/128 mean为0
    batch_y[i, :] = text2vec(text)

  return batch_x, batch_y


####################################################################

X = tf.placeholder(tf.float32, [None, IMAGE_HEIGHT * IMAGE_WIDTH])
Y = tf.placeholder(tf.float32, [None, MAX_CAPTCHA * CHAR_SET_LEN])
keep_prob = tf.placeholder(tf.float32) # dropout


# 定义CNN
def crack_captcha_cnn(w_alpha=0.01, b_alpha=0.1):
  x = tf.reshape(X, shape=[-1, IMAGE_HEIGHT, IMAGE_WIDTH, 1])

  # w_c1_alpha = np.sqrt(2.0/(IMAGE_HEIGHT*IMAGE_WIDTH)) #
  # w_c2_alpha = np.sqrt(2.0/(3*3*32))
  # w_c3_alpha = np.sqrt(2.0/(3*3*64))
  # w_d1_alpha = np.sqrt(2.0/(8*32*64))
  # out_alpha = np.sqrt(2.0/1024)

  # 3 conv layer
  w_c1 = tf.Variable(w_alpha * tf.random_normal([3, 3, 1, 32]))
  b_c1 = tf.Variable(b_alpha * tf.random_normal([32]))
  conv1 = tf.nn.relu(tf.nn.bias_add(tf.nn.conv2d(x, w_c1, strides=[1, 1, 1, 1], padding='SAME'), b_c1))
  conv1 = tf.nn.max_pool(conv1, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')
  conv1 = tf.nn.dropout(conv1, keep_prob)

  w_c2 = tf.Variable(w_alpha * tf.random_normal([3, 3, 32, 64]))
  b_c2 = tf.Variable(b_alpha * tf.random_normal([64]))
  conv2 = tf.nn.relu(tf.nn.bias_add(tf.nn.conv2d(conv1, w_c2, strides=[1, 1, 1, 1], padding='SAME'), b_c2))
  conv2 = tf.nn.max_pool(conv2, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')
  conv2 = tf.nn.dropout(conv2, keep_prob)

  w_c3 = tf.Variable(w_alpha * tf.random_normal([3, 3, 64, 64]))
  b_c3 = tf.Variable(b_alpha * tf.random_normal([64]))
  conv3 = tf.nn.relu(tf.nn.bias_add(tf.nn.conv2d(conv2, w_c3, strides=[1, 1, 1, 1], padding='SAME'), b_c3))
  conv3 = tf.nn.max_pool(conv3, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')
  conv3 = tf.nn.dropout(conv3, keep_prob)

  # Fully connected layer
  w_d = tf.Variable(w_alpha * tf.random_normal([8 * 32 * 40, 1024]))
  b_d = tf.Variable(b_alpha * tf.random_normal([1024]))
  dense = tf.reshape(conv3, [-1, w_d.get_shape().as_list()[0]])
  dense = tf.nn.relu(tf.add(tf.matmul(dense, w_d), b_d))
  dense = tf.nn.dropout(dense, keep_prob)

  w_out = tf.Variable(w_alpha * tf.random_normal([1024, MAX_CAPTCHA * CHAR_SET_LEN]))
  b_out = tf.Variable(b_alpha * tf.random_normal([MAX_CAPTCHA * CHAR_SET_LEN]))
  out = tf.add(tf.matmul(dense, w_out), b_out)
  # out = tf.nn.softmax(out)
  return out


# 训练
def train_crack_captcha_cnn():
  import time
  start_time=time.time()
  output = crack_captcha_cnn()
  # loss
  #loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(output, Y))
  loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=output, labels=Y))
  # 最后一层用来分类的softmax和sigmoid有什么不同?
  # optimizer 为了加快训练 learning_rate应该开始大,然后慢慢衰
  optimizer = tf.train.AdamOptimizer(learning_rate=0.001).minimize(loss)

  predict = tf.reshape(output, [-1, MAX_CAPTCHA, CHAR_SET_LEN])
  max_idx_p = tf.argmax(predict, 2)
  max_idx_l = tf.argmax(tf.reshape(Y, [-1, MAX_CAPTCHA, CHAR_SET_LEN]), 2)
  correct_pred = tf.equal(max_idx_p, max_idx_l)
  accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32))

  saver = tf.train.Saver()
  with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())

    step = 0
    while True:
      batch_x, batch_y = get_next_batch(64)
      _, loss_ = sess.run([optimizer, loss], feed_dict={X: batch_x, Y: batch_y, keep_prob: 0.75})
      print time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time())),step, loss_

      # 每100 step计算一次准确率
      if step % 100 == 0:
        batch_x_test, batch_y_test = get_next_batch(100)
        acc = sess.run(accuracy, feed_dict={X: batch_x_test, Y: batch_y_test, keep_prob: 1.})
        print u'***************************************************************第%s次的准确率为%s'%(step, acc)
        # 如果准确率大于50%,保存模型,完成训练
        if acc > 0.9:         ##我这里设了0.9,设得越大训练要花的时间越长,如果设得过于接近1,很难达到。如果使用cpu,花的时间很长,cpu占用很高电脑发烫。
          saver.save(sess, "crack_capcha.model", global_step=step)
          print time.time()-start_time
          break

      step += 1


train_crack_captcha_cnn()

测试代码:

output = crack_captcha_cnn()
saver = tf.train.Saver()
sess = tf.Session()
saver.restore(sess, tf.train.latest_checkpoint('.'))

while(1):
  

  text, image = gen_captcha_text_and_image()
  image = convert2gray(image)
  image = image.flatten() / 255

  predict = tf.argmax(tf.reshape(output, [-1, MAX_CAPTCHA, CHAR_SET_LEN]), 2)
  text_list = sess.run(predict, feed_dict={X: [image], keep_prob: 1})
  predict_text = text_list[0].tolist()

  vector = np.zeros(MAX_CAPTCHA * CHAR_SET_LEN)
  i = 0
  for t in predict_text:
    vector[i * 63 + t] = 1
    i += 1
    # break



  print("正确: {} 预测: {}".format(text, vec2text(vector)))

如果想要快点测试代码效果,验证码的字符不要设置太多,例如0123这几个数字就可以了。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python模拟鼠标拖动操作的方法
Mar 11 Python
简单介绍Python中的JSON模块
Apr 08 Python
Python 迭代器工具包【推荐】
May 06 Python
Python 提取dict转换为xml/json/table并输出的实现代码
Aug 28 Python
Python连接PostgreSQL数据库的方法
Nov 28 Python
python 调用HBase的简单实例
Dec 18 Python
深入解答关于Python的11道基本面试题
Apr 01 Python
python实现单向链表详解
Feb 08 Python
对python中基于tcp协议的通信(数据传输)实例讲解
Jul 22 Python
python map比for循环快在哪
Sep 21 Python
Python 实现国产SM3加密算法的示例代码
Sep 21 Python
Pycharm添加虚拟解释器报错问题解决方案
Oct 13 Python
使用python获取csv文本的某行或某列数据的实例
Apr 03 #Python
python中实现数组和列表读取一列的方法
Apr 03 #Python
numpy.delete删除一列或多列的方法
Apr 03 #Python
取numpy数组的某几行某几列方法
Apr 03 #Python
Python numpy 提取矩阵的某一行或某一列的实例
Apr 03 #Python
python3安装pip3(install pip3 for python 3.x)
Apr 03 #Python
Win7 64位下python3.6.5安装配置图文教程
Oct 27 #Python
You might like
使用无限生命期Session的方法
2006/10/09 PHP
PHP中单引号与双引号的区别分析
2014/08/19 PHP
ThinkPHP提交表单时默认自动转义的解决方法
2014/11/25 PHP
jQuery 工具函数学习资料
2010/04/29 Javascript
正则表达式搭配js轻松处理json文本方便而老古
2013/02/17 Javascript
Jquery 过滤器(first,last,not,even,odd)的使用
2014/01/22 Javascript
一个简单的jquery的多选下拉框(自写)
2014/05/05 Javascript
分享一个自己写的简单的javascript分页组件
2015/02/15 Javascript
javascript正则表达式定义(语法)总结
2016/01/08 Javascript
js css自定义分页效果
2017/02/24 Javascript
jQuery实现导航回弹效果
2017/02/27 Javascript
深入理解Commonjs规范及Node模块实现
2017/05/17 Javascript
Vue.js 点击按钮显示/隐藏内容的实例代码
2018/02/08 Javascript
微信小程序自定义组件封装及父子间组件传值的方法
2018/08/28 Javascript
JavaScript禁用右键单击优缺点分析
2019/01/20 Javascript
vue2.0自定义指令示例代码详解
2019/04/25 Javascript
小程序云开发教程如何使用云函数实现点赞功能
2019/05/18 Javascript
vue实现分环境打包步骤(给不同的环境配置相对应的打包命令)
2019/06/04 Javascript
python实现逻辑回归的方法示例
2017/05/02 Python
Python解析json之ValueError: Expecting property name enclosed in double quotes: line 1 column 2(char 1)
2017/07/06 Python
python实现人脸识别经典算法(一) 特征脸法
2018/03/13 Python
pycharm 将django中多个app放到同个文件夹apps的处理方法
2018/05/30 Python
python 操作hive pyhs2方式
2019/12/21 Python
详解Python中如何将数据存储为json格式的文件
2020/11/18 Python
HTML5的标签的代码的简单介绍 HTML5标签的简介
2012/05/28 HTML / CSS
俄罗斯韩国化妆品网上商店:Cosmasi.ru
2019/10/31 全球购物
某IT外企面试题-二分法求方程!看看大家的C++功底
2015/07/04 面试题
初始化了一个没有run()方法的线程类,是否会出错?
2014/03/27 面试题
优秀士兵个人事迹材料
2014/01/19 职场文书
同学聚会主持词
2014/03/18 职场文书
让生命充满爱演讲稿
2014/05/10 职场文书
小学亲子活动总结
2014/07/01 职场文书
淘宝客服工作职责
2014/07/11 职场文书
法人代表资格证明书
2015/06/18 职场文书
Python图片检索之以图搜图
2021/05/31 Python
详解Golang如何优雅的终止一个服务
2022/03/21 Golang