编程 Python

python图片验证码识别最新模块muggle_ocr的示例代码

Posted in Python onJuly 03, 2020

一.官方文档

https://pypi.org/project/muggle-ocr/

二模块安装

pip install muggle-ocr
# 因模块过新，阿里/清华等第三方源可能尚未更新镜像，因此手动指定使用境外源，为了提高依赖的安装速度，可预先自行安装依赖：tensorflow/numpy/opencv-python/pillow/pyyaml

三.使用代码

# 导入包
import muggle_ocr

# 初始化；model_type 包含了 ModelType.OCR/ModelType.Captcha 两种
sdk = muggle_ocr.SDK(model_type=muggle_ocr.ModelType.OCR)
# ModelType.OCR 可识别光学印刷文本 这里个人觉得应该是官方文档写错了 官方文档是ModelType.Captcha 可识别光学印刷文本
with open(r"test1.png", "rb") as f:
 b = f.read()
text = sdk.predict(image_bytes=b)
print(text)

# ModelType.Captcha 可识别4-6位验证码
sdk = muggle_ocr.SDK(model_type=muggle_ocr.ModelType.Captcha)
with open(r"test1.png", "rb") as f:
 b = f.read()
text = sdk.predict(image_bytes=b)
print(text)

PS：下面看下 Python 实现全自动登录(真正的全自动，自动识别验证码)

你没有看错，全自动验证~~~

黑科技？还是黑代码？
我感觉这个看在你用啥，对不对？反正我用来（* * * * ）你懂得

好了，先说一下用到的东西

selenium (本意是用来全自动测试)
Phantomjs (一种没有界面的浏览器)
** 验证码识别器（一块钱可用100次的这种）

关门放代码

from selenium import webdriver
from PIL import Image
if __name__ == '__main__':
 wbe = webdriver.PhantomJS()
 wbe.get("https://www.某个网站的登录页面.com/login/index.html")//你可以拿知乎，百度，等等测试
 element = wbe.find_element_by_xpath('//*[@id="entry_name"]/p[3]/img')//验证码所在的xpath路径
 left = element.location['x']
 top = element.location['y']
 right = element.location['x'] + element.size['width']
 bottom = element.location['y'] + element.size['height']
 im = Image.open(r'登录页.png')//全页面截屏
 im = im.crop((left, top, right, bottom))
 im.save('验证码.png')

#!/usr/bin/env python
# coding:utf-8
import requests
from hashlib import md5
class RClient(object):
 def __init__(self, username, password, soft_id, soft_key):
  self.username = username
  self.password = md5(password).hexdigest()
  self.soft_id = soft_id
  self.soft_key = soft_key
  self.base_params = {
   'username': self.username,
   'password': self.password,
   'softid': self.soft_id,
   'softkey': self.soft_key,
  }
  self.headers = {
   'Connection': 'Keep-Alive',
   'Expect': '100-continue',
   'User-Agent': 'ben',
  }
 def rk_create(self, im, im_type, timeout=60):
  """
  im: 图片字节
  im_type: 题目类型
  """
  params = {
   'typeid': im_type,
   'timeout': timeout,
  }
  params.update(self.base_params)
  files = {'image': ('a.png', im)}
  r = requests.post('http://api.ruokuai.com/create.json', data=params, files=files, headers=self.headers)
  return r.json()
 def rk_report_error(self, im_id):
  """
  im_id:报错题目的ID
  """
  params = {
   'id': im_id,
  }
  params.update(self.base_params)
  r = requests.post('http://api.ruokuai.com/reporterror.json', data=params, headers=self.headers)
  return r.json()
def get_code():
 rc = RClient('用户名', '密码', '94522', '62c235939b7240879453f31603733fd6')//想拿下测试的留言我，教你拿到测试账号
 im = open('a.png', 'rb').read()
 print rc.rk_create(im, 3040)

完整代码

#!/usr/bin/env python
# coding:utf-8
from selenium import webdriver
from PIL import Image
import requests
from hashlib import md5
import time
class RClient(object):
 def __init__(self, username, password, soft_id, soft_key):
  self.username = username
  self.password = md5(password.encode("utf-8")).hexdigest()
  self.soft_id = soft_id
  self.soft_key = soft_key
  self.base_params = {
   'username': self.username,
   'password': self.password,
   'softid': self.soft_id,
   'softkey': self.soft_key,
  }
  self.headers = {
   'Connection': 'Keep-Alive',
   'Expect': '100-continue',
   'User-Agent': 'ben',
  }
 def rk_create(self, im, im_type, timeout=60):
  """
  im: 图片字节
  im_type: 题目类型
  """
  params = {
   'typeid': im_type,
   'timeout': timeout,
  }
  params.update(self.base_params)
  files = {'image': ('a.png', im)}
  r = requests.post('http://api.ruokuai.com/create.json', data=params, files=files, headers=self.headers)
  return r.json()
 def rk_report_error(self, im_id):
  """
  im_id:报错题目的ID
  """
  params = {
   'id': im_id,
  }
  params.update(self.base_params)
  r = requests.post('http://api.ruokuai.com/reporterror.json', data=params, headers=self.headers)
  return r.json()
def get_code(im_file):
 rc = RClient('账号', '密码', '94522', '62c235939b7240879453f31603733fd6')
 im_source = open(im_file, "rb").read()
 print(rc.rk_create(im_source, 3040))
if __name__ == '__main__':
 wbe = webdriver.PhantomJS()
 wbe.get("https://www.dajiang365.com/login/index.html")
 time.sleep(2)
 wbe.save_screenshot("das.png")
 element = wbe.find_element_by_xpath('//*[@id="entry_name"]/p[3]/img')
 left = element.location['x']
 top = element.location['y']
 right = element.location['x'] + element.size['width']
 bottom = element.location['y'] + element.size['height']
 im = Image.open(r'das.png')
 im = im.crop((left, top, right, bottom))
 im.save('a.png')
 time.sleep(2)
 get_code("a.png")

总结

到此这篇关于python图片验证码识别最新模块muggle_ocr的示例代码的文章就介绍到这了,更多相关python 验证码识别模块muggle_ocr内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木！

python图片验证码识别最新模块muggle_ocr的示例代码

- Author -

小小咸鱼YwY

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

在Python中利用Pandas库处理大数据的简单介绍

Apr 07 Python

举例讲解Python中的算数运算符的用法

May 13 Python

Python爬取国外天气预报网站的方法

Jul 10 Python

详解python中Numpy的属性与创建矩阵

Sep 10 Python

Python连接Redis的基本配置方法

Sep 13 Python

pycharm 在windows上编辑代码用linux执行配置的方法

Oct 27 Python

python配置grpc环境

Jan 01 Python

解决Pandas的DataFrame输出截断和省略的问题

Feb 08 Python

YUV转为jpg图像的实现

Dec 09 Python

Pytorch Tensor 输出为txt和mat格式方式

Jan 03 Python

Python表达式的优先级详解

Feb 18 Python

将tf.batch_matmul替换成tf.matmul的实现

Jun 18 Python

keras topN显示,自编写代码案例

Jul 03 #Python

python如何使用代码运行助手

Jul 03 #Python

Python 3.10 的首个 PEP 诞生,内置类型 zip() 迎来新特性(推荐)

Jul 03 #Python

python3 简单实现组合设计模式

Jul 02 #Python

Django Session和Cookie分别实现记住用户登录状态操作

Jul 02 #Python

django 装饰器检测登录状态操作

Jul 02 #Python

详解用Python爬虫获取百度企业信用中企业基本信息

Jul 02 #Python

You might like

PHP字符串处理的10个简单方法

2010/06/30 PHP

PHP 删除文件与文件夹操作 unlink()与rmdir()这两个函数的使用

2011/07/17 PHP

PHP之短标签开启设置

2013/06/17 PHP

解析数组非数字键名引号的必要性

2013/08/09 PHP

ZF框架实现发送邮件的方法

2015/12/03 PHP

必须收藏的23个php实用代码片段

2016/02/02 PHP

PHP性能分析工具xhprof的安装使用与注意事项

2017/12/19 PHP

PHP将整数数字转换为罗马数字实例分享

2019/03/17 PHP

解决FLASH需要点击激活的代码

2006/12/20 Javascript

JS图片切换的具体方法(带缩略图版)

2013/11/12 Javascript

现如今最流行的JavaScript代码规范

2014/03/08 Javascript

JavaScript获取当前日期是星期几的方法

2015/04/06 Javascript

JavaSciprt中处理字符串之sup()方法的使用教程

2015/06/08 Javascript

很酷的星级评分系统原生JS实现

2016/08/25 Javascript

原生js实现回复评论功能

2017/01/18 Javascript

ES6中Array.includes()函数的用法

2017/09/20 Javascript

深入浅析Vue.js计算属性和侦听器

2018/05/05 Javascript

vue中render函数的使用详解

2018/10/12 Javascript

使用原生js编写一个简单的框选功能方法

2019/05/13 Javascript

Js代码中的span拼接问题解决

2019/11/22 Javascript

mpvue 项目初始化及实现授权登录的实现方法

2020/07/20 Javascript

node.js爬虫框架node-crawler初体验

2020/10/29 Javascript

[03:58]2014DOTA2国际邀请赛龙宝赛后解密DK获胜之道

2014/07/14 DOTA

详解python单元测试框架unittest

2018/07/02 Python

pycharm 解除默认unittest模式的方法

2018/11/30 Python

python实现flappy bird小游戏

2018/12/24 Python

python二分法查找算法实现方法【递归与非递归】

2019/12/06 Python

三星印度官网：Samsung印度

2019/08/03 全球购物

土建专业大学生自荐信范文

2014/04/09 职场文书

《一个小村庄的故事》教学反思

2014/04/13 职场文书

办公室文员岗位职责

2015/02/04 职场文书

工资证明范本

2015/06/12 职场文书

初中语文教学随笔

2015/08/15 职场文书

vue.js Router中嵌套路由的实用示例

2021/06/27 Vue.js

「约定的梦幻岛」作画发布诺曼生日新绘

2022/03/21 日漫

ORACLE中dbms_output.put_line输出问题的解决过程

2022/06/28 Oracle