如何用python识别滑块验证码中的缺口


Posted in Python onApril 01, 2021

验证码往往是爬虫路上的一只拦路虎,而其花样也是层出不穷:图片验证、滑块验证、交互式验证、行为验证等。随着OCR技术的成熟,图片验证已经渐渐淡出主流,而滑块验证越来越多地出现在大众视野。
“这么厉害,这小子长啥样呢?”没错,它就长这损sai:

如何用python识别滑块验证码中的缺口

解决它的方法也很直观,首先找到缺口的位置(通常只需要X轴的位置),然后拖动滑块即可。
今天kimol君将带领大家用python识别出滑块验证中的缺口位置。

一、缺口识别

识别图片中的缺口,主要是利用python中的图像处理库cv2,其安装方法如下:

pip install opencv-python

注:这里并不是“pip install cv2”哦~

1.读取图片

滑块验证的图片分为两部分,一个是背景图片:

如何用python识别滑块验证码中的缺口

另一个是缺口图片:

如何用python识别滑块验证码中的缺口

利用imread函数将其读取:

# 读取背景图片和缺口图片
bg_img = cv2.imread('bg.jpg') # 背景图片
tp_img = cv2.imread('tp.png') # 缺口图片

2.识别图片边缘

为了更好地将缺口与背景匹配,我们首先得识别出图片的边缘:

# 识别图片边缘
bg_edge = cv2.Canny(bg_img, 100, 200)
tp_edge = cv2.Canny(tp_img, 100, 200)

这一步很关键!否则缺口匹配将不准确。

这里得到了图片边缘的灰度图,进一步将其图片格式转为RGB格式:

# 转换图片格式
bg_pic = cv2.cvtColor(bg_edge, cv2.COLOR_GRAY2RGB)
tp_pic = cv2.cvtColor(tp_edge, cv2.COLOR_GRAY2RGB)

转换后的背景图为:

如何用python识别滑块验证码中的缺口

转换后的缺口图为:

如何用python识别滑块验证码中的缺口

3.缺口匹配

利用cv2中的matchTemplate函数,可以在背景图片中搜索对应的缺口,具体代码如下:

# 缺口匹配
res = cv2.matchTemplate(bg_pic, tp_pic, cv2.TM_CCOEFF_NORMED)

res为每个位置的匹配结果,代表了匹配的概率,选出其中概率最高的点,即为缺口匹配的位置:

min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res) # 寻找最优匹配

min_val,max_val,min_loc,max_loc分别为匹配的最小值、匹配的最大值、最小值的位置、最大值的位置。
ps.当然,这里完全可以自己写一个循环来实现,但是有现成的函数为什么不用呢?

至此,我们已经有了缺口的位置,其X轴坐标为:

X = max_loc[0]

为了更直观地展示缺口的位置,我们将缺口用矩形框标注出来:

# 绘制方框
th, tw = tp_pic.shape[:2] 
tl = max_loc # 左上角点的坐标
br = (tl[0]+tw,tl[1]+th) # 右下角点的坐标
cv2.rectangle(bg_img, tl, br, (0, 0, 255), 2) # 绘制矩形
cv2.imwrite('out.jpg', bg_img) # 保存在本地

结果如下:

如何用python识别滑块验证码中的缺口

完美~ 收工!!!

二、完整代码

为了在实际应用中更方便的使用,我们将代码封装为一个函数:

def identify_gap(bg,tp,out):
 '''
 bg: 背景图片
 tp: 缺口图片
 out:输出图片
 '''
 # 读取背景图片和缺口图片
 bg_img = cv2.imread(bg) # 背景图片
 tp_img = cv2.imread(tp) # 缺口图片
 
 # 识别图片边缘
 bg_edge = cv2.Canny(bg_img, 100, 200)
 tp_edge = cv2.Canny(tp_img, 100, 200)
 
 # 转换图片格式
 bg_pic = cv2.cvtColor(bg_edge, cv2.COLOR_GRAY2RGB)
 tp_pic = cv2.cvtColor(tp_edge, cv2.COLOR_GRAY2RGB)
 
 # 缺口匹配
 res = cv2.matchTemplate(bg_pic, tp_pic, cv2.TM_CCOEFF_NORMED)
 min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res) # 寻找最优匹配
 
 # 绘制方框
 th, tw = tp_pic.shape[:2] 
 tl = max_loc # 左上角点的坐标
 br = (tl[0]+tw,tl[1]+th) # 右下角点的坐标
 cv2.rectangle(bg_img, tl, br, (0, 0, 255), 2) # 绘制矩形
 cv2.imwrite(out, bg_img) # 保存在本地
 
 # 返回缺口的X坐标
 return tl[0]

这里选择了读取本地图片文件,在爬虫过程中其实不是特别方便。如果有感兴趣的小伙伴,可以自己改动一下,将输入改为图片流即可。

以上就是如何用python识别滑块中的缺口的详细内容,更多关于python识别滑块中的缺口的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python实现的文件夹清理程序分享
Nov 22 Python
Python彩色化Linux的命令行终端界面的代码实例分享
Jul 02 Python
Numpy数组转置的两种实现方法
Apr 17 Python
tensorflow 恢复指定层与不同层指定不同学习率的方法
Jul 26 Python
Python多线程处理实例详解【单进程/多进程】
Jan 30 Python
python代码编写计算器小程序
Mar 30 Python
python实现飞机大战游戏(pygame版)
Oct 26 Python
python+selenium定时爬取丁香园的新型冠状病毒数据并制作出类似的地图(部署到云服务器)
Feb 09 Python
TensorBoard 计算图的查看方式
Feb 15 Python
Python+Opencv实现把图片、视频互转的示例
Dec 17 Python
在Windows下安装配置CPU版的PyTorch的方法
Apr 02 Python
用PYTHON去计算88键钢琴的琴键频率和音高
Apr 10 Python
python 实现定时任务的四种方式
Apr 01 #Python
python读取pdf格式文档的实现代码
Python中使用Lambda函数的5种用法
Apr 01 #Python
python 实现mysql自动增删分区的方法
Apr 01 #Python
pygame面向对象的飞行小鸟实现(Flappy bird)
如何用python插入独创性声明
python OpenCV学习笔记
You might like
php木马攻击防御之道
2008/03/24 PHP
php 魔术方法使用说明
2009/10/20 PHP
PHP 无限分类三种方式 非函数的递归调用!
2011/08/26 PHP
phplot生成图片类用法详解
2015/01/06 PHP
在laravel5.2中实现点击用户头像更改头像的方法
2019/10/14 PHP
强大的jquery插件jqeuryUI做网页对话框效果!简单
2011/04/14 Javascript
JavaScript实现网页对象拖放功能的方法
2015/04/15 Javascript
深入浅析react native es6语法
2015/12/09 Javascript
js实现延迟加载的几种方法
2017/04/24 Javascript
基于JS实现限时抢购倒计时间表代码
2017/05/09 Javascript
javascript 中iframe高度自适应(同域)实例详解
2017/05/16 Javascript
通过一次报错详细谈谈Point事件
2018/05/17 Javascript
jQuery实现输入框的放大和缩小功能示例
2018/07/21 jQuery
详解JavaScript作用域和作用域链
2019/03/19 Javascript
微信小程序实现定位及到指定位置导航的示例代码
2019/08/20 Javascript
vue项目中在可编辑div光标位置插入内容的实现代码
2020/01/07 Javascript
jQuery实现移动端图片上传预览组件的方法分析
2020/05/01 jQuery
vue 动态给每个页面添加title、关键词和描述的方法
2020/08/28 Javascript
vue 项目引入echarts 添加点击事件操作
2020/09/09 Javascript
js实现电灯开关效果
2021/01/19 Javascript
浅析Python中else语句块的使用技巧
2016/06/16 Python
Python找出最小的K个数实例代码
2018/01/04 Python
python使用锁访问共享变量实例解析
2018/02/08 Python
Python实现正弦信号的时域波形和频谱图示例【基于matplotlib】
2018/05/04 Python
Python实战之制作天气查询软件
2019/05/14 Python
在主流系统之上安装Pygame的方法
2020/05/20 Python
python如何获得list或numpy数组中最大元素对应的索引
2020/11/16 Python
详解CSS 3 中的 calc() 方法
2018/01/12 HTML / CSS
LINUX下线程,GDI类的解释
2012/04/17 面试题
应届生幼儿园求职信
2013/11/12 职场文书
人事科岗位职责范本
2014/03/02 职场文书
《桃林那间小木屋》教学反思
2014/05/01 职场文书
新闻学专业职业生涯规划范文:我的人生我做主
2014/09/12 职场文书
2014年档案管理工作总结
2014/11/17 职场文书
2015年秋季小学开学典礼主持词
2015/07/16 职场文书
关于mysql中时间日期类型和字符串类型的选择
2021/11/27 MySQL