基于python实现破解滑动验证码过程解析


Posted in Python onMay 28, 2020

前言:

很多小伙伴们反馈,在web自动化的过程中,经常会被登录的验证码给卡住,不知道如何去通过验证码的验证。今天专门给大家来聊聊验证码的问题,一般的情况下遇到验证码我们可以都可以找开发去帮忙解决,关闭验证码,或者给一个万能的验证码!那么如果开发不提供帮助的话,我们自己有没有办法来处理这些验证码的问题呢?答案当然是有的,常见的验证码一般分为两类,一类是图文验证码,一类是滑动验证码!

基于python实现破解滑动验证码过程解析

今天我们主要来聊聊滑动验证码如何去识别破解。

滑动验证破解思路

关于滑动验证码破解的思路大体上来讲就是以下两个步骤:

1、获取滑块滑动的距离

2、模拟拖动滑块,通过验证。

听起来是比较简单,但是获取滑块滑动的距离,大多数小伙伴没有思路,不知道怎么去获取。其实要获取下来也不难,关于这种滑动的验证码,滑块和缺口背景都是分别是一张独立的图片,我们可以把这两张图片,下载下来借助于图像识别的技术,去识别缺口在背景图中的位置,然后减去滑块当前所在位置,就可以得出需要滑动的距离。这个时候很多小伙伴会想图像识别技术我不会啊,不会没有关系,后面会给到大家一个封装好的滑块识别模块,只要你传入滑块和缺口背景图的元素节点就能计算出滑块的缺口位置。

案例讲解

话不多说,我们先来看一个案例(QQ空间登录),这边用到了一个我自己封装的滑动距离识别的模块slideVerfication,有需要的小伙伴可以私聊获取。qq空间登录案例实现步骤如下:

1、创建一个driver对象,访问qq登录页面

2、输入账号密码

3、点击登录

4、模拟滑动验证

实现代码

import time
 from selenium import webdriver
 from slideVerfication import SlideVerificationCode
 ​
 # 1、创建一个driver对象,访问qq登录页面
 browser = webdriver.Chrome()
 browser.get("https://qzone.qq.com/")
 ​
 # 2、输入账号密码
 # 2.0 点击切换到登录的iframe
 browser.switch_to.frame('login_frame')
 # 2.1 点击账号密码登录
 browser.find_element_by_id('switcher_plogin').click()
 # 2.2定位账号输入框,输入账号
 browser.find_element_by_id("u").send_keys("123292678")
 # 2.3定位密码输入输入密码
 browser.find_element_by_id("p").send_keys("PYTHON01")
 # 3、点击登录
 browser.find_element_by_id('login_button').click()
 time.sleep(3)
 ​
 # 4、模拟滑动验证
 # 4.1切换到滑动验证码的iframe中
 tcaptcha = browser.find_element_by_id("tcaptcha_iframe")
 browser.switch_to.frame(tcaptcha)
 # 4.2 获取滑动相关的元素
 # 选择拖动滑块的节点
 slide_element = browser.find_element_by_id('tcaptcha_drag_thumb')
 # 获取滑块图片的节点
 slideBlock_ele = browser.find_element_by_id('slideBlock')
 # 获取缺口背景图片节点
 slideBg = browser.find_element_by_id('slideBg')
 # 4.3计算滑动距离
 sc = SlideVerificationCode(save_image=True)
 distance = sc.get_element_slide_distance(slideBlock_ele,slideBg)
 # 滑动距离误差校正,滑动距离*图片在网页上显示的缩放比-滑块相对的初始位置
 distance = distance*(280/680) - 22
 print("校正后的滑动距离",distance)
 # 4.4、进行滑动
 sc.slide_verification(browser,slide_element,distance=100)

基于python实现破解滑动验证码过程解析

关于滑动验证码的识别问题就这样解决了,那么接下来给大家来讲讲封装的slideVerfication这个模块的识别原理,其实关于这个模块图像识别,也是借助了第三方的图像处理模块来进行识别的,python中有很多现成的用来处理图片的库,这边我使用的是opencv-python来进行识别的。slideVerfication模块上面用到的两个方法的部分参考代码如下:

def get_element_slide_distance(self, slider_ele, background_ele, correct=0):
     """
     根据传入滑块,和背景的节点,计算滑块的距离
 ​
     该方法只能计算 滑块和背景图都是一张完整图片的场景,
     如果背景图是通过多张小图拼接起来的背景图,
     该方法不适用,请使用get_image_slide_distance这个方法
     :param slider_ele: 滑块图片的节点
     :type slider_ele: WebElement
     :param background_ele: 背景图的节点
     :type background_ele:WebElement
     :param correct:滑块缺口截图的修正值,默认为0,调试截图是否正确的情况下才会用
     :type: int
     :return: 背景图缺口位置的X轴坐标位置(缺口图片左边界位置)
     """
     # 获取验证码的图片
     slider_url = slider_ele.get_attribute("src")
     background_url = background_ele.get_attribute("src")
     # 下载验证码背景图,滑动图片
     slider = "slider.jpg"
     background = "background.jpg"
     self.onload_save_img(slider_url, slider)
     self.onload_save_img(background_url, background)
     # 读取进行色度图片,转换为numpy中的数组类型数据,
     slider_pic = cv2.imread(slider, 0)
     background_pic = cv2.imread(background, 0)
     # 获取缺口图数组的形状 -->缺口图的宽和高
     width, height = slider_pic.shape[::-1]
     # 将处理之后的图片另存
     slider01 = "slider01.jpg"
     background_01 = "background01.jpg"
     cv2.imwrite(background_01, background_pic)
     cv2.imwrite(slider01, slider_pic)
     # 读取另存的滑块图
     slider_pic = cv2.imread(slider01)
     # 进行色彩转换
     slider_pic = cv2.cvtColor(slider_pic, cv2.COLOR_BGR2GRAY)
     # 获取色差的绝对值
     slider_pic = abs(255 - slider_pic)
     # 保存图片
     cv2.imwrite(slider01, slider_pic)
     # 读取滑块
     slider_pic = cv2.imread(slider01)
     # 读取背景图
     background_pic = cv2.imread(background_01)
     # 比较两张图的重叠区域
     result = cv2.matchTemplate(slider_pic, background_pic, cv2.TM_CCOEFF_NORMED)
     # 获取图片的缺口位置
     top, left = np.unravel_index(result.argmax(), result.shape)
     # 背景图中的图片缺口坐标位置
     print("当前滑块的缺口位置:", (left, top, left + width, top + height))
     return left
   def slide_verification(self, driver, slide_element, distance):
     """
     滑动滑块进行验证
     
     :param driver: driver对象
     :type driver:webdriver.Chrome
     :param slide_element: 滑块的元组
     :type slider_ele: WebElement
     :param distance: 滑动的距离
     :type: int
     :return:
     """
     # 获取滑动前页面的url地址
     start_url = driver.current_url
     print("需要滑动的距离为:", distance)
     # 根据滑动距离生成滑动轨迹
     locus = self.get_slide_locus(distance)
     print("生成的滑动轨迹为:{},轨迹的距离之和为{}".format(locus, distance))
     # 按下鼠标左键
     ActionChains(driver).click_and_hold(slide_element).perform()
     time.sleep(0.5)
     # 遍历轨迹进行滑动
     for loc in locus:
       time.sleep(0.01)
       ActionChains(driver).move_by_offset(loc, random.randint(-5, 5)).perform()
       ActionChains(driver).context_click(slide_element)
     # 释放鼠标
     ActionChains(driver).release(on_element=slide_element).perform()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python自定义scrapy中间模块避免重复采集的方法
Apr 07 Python
python查看模块安装位置的方法
Oct 16 Python
python之cv2与图像的载入、显示和保存实例
Dec 05 Python
Python实现计算字符串中出现次数最多的字符示例
Jan 21 Python
Python django框架应用中实现获取访问者ip地址示例
May 17 Python
对Python生成器、装饰器、递归的使用详解
Jul 19 Python
Pytorch之finetune使用详解
Jan 18 Python
python实现交并比IOU教程
Apr 16 Python
Python调用C/C++的方法解析
Aug 05 Python
Python Opencv实现单目标检测的示例代码
Sep 08 Python
Python实例教程之检索输出月份日历表
Dec 16 Python
python装饰器代码深入讲解
Mar 01 Python
PythonPC客户端自动化实现原理(pywinauto)
May 28 #Python
基于Pyinstaller打包Python程序并压缩文件大小
May 28 #Python
Python selenium 加载并保存QQ群成员,去除其群主、管理员信息的示例代码
May 28 #Python
Python爬虫requests库多种用法实例
May 28 #Python
在pycharm中创建django项目的示例代码
May 28 #Python
python中有函数重载吗
May 28 #Python
Python可以实现栈的结构吗
May 27 #Python
You might like
珊瑚虫IP库浅析
2007/02/15 PHP
PDO防注入原理分析以及使用PDO的注意事项总结
2014/10/23 PHP
PHP利用header跳转失效的解决方法
2014/10/24 PHP
PHP使用xmllint命令处理xml与html的方法
2014/12/15 PHP
主流PHP框架的优缺点对比分析
2014/12/25 PHP
php计算函数执行时间的方法
2015/03/20 PHP
PHP中使用curl入门教程
2015/07/02 PHP
PHP给前端返回一个JSON对象的实例讲解
2018/05/31 PHP
CCPry JS类库 代码
2009/10/30 Javascript
location.href 在IE6中不跳转的解决方法与推荐使用代码
2010/07/08 Javascript
利用谷歌地图API获取点与点的距离的js代码
2012/10/11 Javascript
用表格输出1-1000之间的数字实现代码(附特效)
2013/04/21 Javascript
jQuery判断密码强度实现思路及代码
2013/04/24 Javascript
JS实现匀速运动的代码实例
2013/11/29 Javascript
在myeclipse中如何加入jquery代码提示功能
2014/06/03 Javascript
jQuery中用dom操作替代正则表达式
2014/12/29 Javascript
JavaScript对象数组如何按指定属性和排序方向进行排序
2016/06/15 Javascript
详谈Ajax请求中的async:false/true的作用(ajax 在外部调用问题)
2017/02/10 Javascript
javaScript+turn.js实现图书翻页效果实例代码
2017/02/16 Javascript
jQuery+HTML5实现WebGL高性能烟花绽放动画效果【附demo源码下载】
2017/08/18 jQuery
layui table 多行删除(id获取)的方法
2019/09/12 Javascript
JavaScript缺少insertAfter解决方案
2020/07/03 Javascript
vue 子组件修改data或调用操作
2020/08/07 Javascript
[00:26]TI7不朽珍藏III——冥界亚龙不朽展示
2017/07/15 DOTA
python 算法 排序实现快速排序
2012/06/05 Python
Python中set与frozenset方法和区别详解
2016/05/23 Python
关于Python作用域自学总结
2019/06/10 Python
python 使用shutil复制图片的例子
2019/12/13 Python
python GUI库图形界面开发之PyQt5信号与槽基础使用方法与实例
2020/03/06 Python
如何教少儿学习Python编程
2020/07/10 Python
HTML5: Web 标准最巨大的飞跃
2008/10/17 HTML / CSS
英国户外玩具儿童游乐设备网站:TP Toys(蹦床、攀爬框架、秋千、滑梯和游戏屋)
2018/04/09 全球购物
商场开业庆典策划方案
2014/06/02 职场文书
第二批党的群众路线教育实践活动总结报告
2014/10/30 职场文书
2019年年中工作总结讲话稿模板
2019/03/25 职场文书
spring cloud 配置中心客户端启动遇到的问题
2021/09/25 Java/Android