selenium 反爬虫之跳过淘宝滑块验证功能的实现代码


Posted in Javascript onAugust 27, 2020

在处理问题的之前,给大家个第一个锦囊!

你需要将chorme更新到最新版版本84,下载对应的chorme驱动 链接:http://chromedriver.storage.googleapis.com/index.html
注意 划重点!!一定要做这一步,因为我用的83的chorme他是不行滴,~~~~~~~

问题

1.一周前我的滑块验证代码还是可以OK的,完全没问题!附代码 low一眼

url = "https://login.taobao.com/member/login.jhtml"
browser.get(url)
browser.maximize_window() # 最大化

# 填写用户名密码
user = '*****'
password = '*******'
time.sleep(8)

iframe = browser.find_element_by_xpath('//div[@class="bokmXvaDlH"]//iframe')
print(iframe)
browser.switch_to.frame(iframe)
browser.find_element_by_xpath('//*[@id="fm-login-id"]').send_keys(id)
browser.find_element_by_xpath('//*[@id="fm-login-password"]').send_keys(password)
time.sleep(2)
# 获取滑块的大小
span_background = browser.find_element_by_xpath('//*[@id="nc_1__scale_text"]/span')
span_background_size = span_background.size
print(span_background_size)

# 获取滑块的位置
button = browser.find_element_by_xpath('//*[@id="nc_1_n1z"]')
button_location = button.location
print(button_location)

# 拖动操作:drag_and_drop_by_offset
# 将滑块的位置由初始位置,右移一个滑动条长度(即为x坐标在滑块位置基础上,加上滑动条的长度,y坐标保持滑块的坐标位置)
x_location = span_background_size["width"]
y_location = button_location["y"]
print(x_location, y_location)
action = ActionChains(browser)
source = browser.find_element_by_xpath('//*[@id="nc_1_n1z"]')
action.click_and_hold(source).perform()
action.move_by_offset(300, 0)
action.release().perform()
time.sleep(1)

# 登录
browser.find_element_by_xpath('//*[@id="login-form"]/div[4]/button').click()
print('登录成功\n')

完全可以会很好的进入淘宝,游刃有余
2.淘宝爸爸一周后就给我泼凉水,增加了自己的反爬虫机制,出现如下错误。

selenium 反爬虫之跳过淘宝滑块验证功能的实现代码

刚开始我以为是我频繁登录,导致淘宝的机器人识别我为代码进入。一般之前都是会在30分钟内解封。结果一天之后还是存在这个问题。查阅资料,翻了我的葵花宝典还是没有解决办法。后来看到一个文章,可能是淘宝再次更新了自己对selenium的验证,导致我不在成为漏网之鱼。唉唉唉,导致我3天没有解决。现在我把自己的坑和解决办法给大家分享一哈。成功的再次成为漏网之鱼,哈哈哈!

步骤

1.首先很多熟悉JS的人都知道淘宝会检测window.navigator.webdriver(js检测特征之一),但是即使设置了"undefined"还是败下来,看看

selenium 反爬虫之跳过淘宝滑块验证功能的实现代码

2.这时候细心的就需要观察一下他的全局JS,(这个是我参考别人的思路)你会发现淘宝爸爸在你浏览器内置的JS中有这么一段恐怖的代码

selenium 反爬虫之跳过淘宝滑块验证功能的实现代码

就是这个标黄色的东西,不会容易被发现的东西被检测到你是selenium进入,是不是特别坑!那我们接下来就需要干掉他。
3.这个时候仔细想一下,我们是通过什么打开浏览器呢?是的,知道的都会说webdriver.exe这个驱动。那我们就从他开始下手,当你打开webdriver.exe它后你会发现其中的问题!
注意:划重点!!!怎么打开和修改webdriver.exe。很多人都是乱码,之前我看到Windows系统采用nodepad++去打开就可以了,注意我的不行!你们可以试一下。(有的人是可以的,但是我的老师电脑不可以),然后我就找了一个办法,需要大家会一点vim操作,很简单的!准确的说就是Linux去解决,因为他不存在编码问题,不会像傻Windows,特别蠢!!开发人员最好还是用Linux系统吧!
经过我认真不负努力的搜索,诶找到一个靠谱的文章,哈哈!外国的‘知乎'
文章链接:https://stackoverflow.com/questions/33225947/can-a-website-detect-when-you-are-using-selenium-with-chromedriver
就是他!

selenium 反爬虫之跳过淘宝滑块验证功能的实现代码

就是这段翻译后的操作。
注意 划重点 !!采用Linux系统的vim进去后你看到的也是乱码!!哈哈,but和Windows的乱码是不一样的,他会让你找到“$cdc_asdjflasutopfhvcZLmcfl_”这个字符串的,神奇吧。这就是Linux的强大!!
不会Linux命令的童鞋可以自己搜索一下,很简单的。修改后记得要保存哦!

4.可能大家觉得到这里就可以了,NO NO NO 这样子你还是登录不掉的。需要最后一个锦囊妙计!!
具体就是 你需要关闭chorme开发者模式,关闭自动测试状态,还需要将大家都熟知的把window.navigator.webdriver设为"undefined"。可能说的不太明白,图片帮你理解

selenium 反爬虫之跳过淘宝滑块验证功能的实现代码

# chrome_options 初始化选项
  chrome_options = webdriver.ChromeOptions()

  # 设置浏览器初始 位置x,y & 宽高x,y
  chrome_options.add_argument(f'--window-position={217},{172}')
  chrome_options.add_argument(f'--window-size={1200},{1000}')

  # 关闭自动测试状态显示 // 会导致浏览器报:请停用开发者模式
  # window.navigator.webdriver还是返回True,当返回undefined时应该才可行。
  chrome_options.add_experimental_option("excludeSwitches", ['enable-automation'])

加上这个代码会关闭“正受到自动测试软件的控制“的显示

selenium 反爬虫之跳过淘宝滑块验证功能的实现代码

# 通过浏览器的dev_tool在get页面钱将.webdriver属性改为"undefined"
  driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
    "source": """Object.defineProperty(navigator, 'webdriver', {get: () => undefined})""",
  })

加上这个代码可以关闭开发者模式

selenium 反爬虫之跳过淘宝滑块验证功能的实现代码

# 通过浏览器的dev_tool在get页面钱将.webdriver属性改为"undefined"
  driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
    "source": """Object.defineProperty(navigator, 'webdriver', {get: () => undefined})""",
  })

最后我们通过提前运行js的方法,把window.navigator.webdriver设为"undefined"!
OK !!大功告成!!通过这么一步步下来,你会发现 我的天居然没有滑块!开森!!

总结

到此这篇关于selenium 反爬虫之跳过淘宝滑块验证(2020/8)的文章就介绍到这了,更多相关selenium 跳过淘宝滑块验证内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Javascript 相关文章推荐
简易js代码实现计算器操作
Apr 15 Javascript
Jquery实现列表(隔行换色,全选,鼠标滑过当前行)效果实例
Jun 09 Javascript
JS获取URL中参数值(QueryString)的4种方法分享
Apr 12 Javascript
jquery显示隐藏input对象
Jul 21 Javascript
用console.table()调试javascript
Sep 04 Javascript
基于javascript代码实现通过点击图片显示原图片
Nov 29 Javascript
JS使用正则截取两个字符串之间的字符串实现方法详解
Jan 06 Javascript
Javascript中引用类型传递的知识点小结
Mar 06 Javascript
node+vue实现用户注册和头像上传的实例代码
Jul 20 Javascript
详解Vue2 SSR 缓存 Api 数据
Nov 20 Javascript
解决jquery的ajax调取后端数据成功却渲染失败的问题
Aug 08 jQuery
微信小程序视频弹幕发送功能的实现
Dec 28 Javascript
JS实现拖拽元素时与另一元素碰撞检测
Aug 27 #Javascript
js实现QQ邮箱邮件拖拽删除功能
Aug 27 #Javascript
Bootstrap告警框(alert)实现弹出效果和短暂显示后上浮消失的示例代码
Aug 27 #Javascript
javascript操作向表格中动态加载数据
Aug 27 #Javascript
Vue为什么要谨慎使用$attrs与$listeners
Aug 27 #Javascript
js实现批量删除功能
Aug 27 #Javascript
js利用拖放实现添加删除
Aug 27 #Javascript
You might like
PHP安全配置详细说明
2011/09/26 PHP
php通过两层过滤获取留言内容的方法
2016/07/11 PHP
PHP检查网站是否宕机的方法示例
2017/07/24 PHP
PHP实现唤起微信支付功能
2019/02/18 PHP
关于Laravel-admin的基础用法总结和自定义model详解
2019/10/08 PHP
asp.net和php的区别点总结
2019/10/10 PHP
获取JavaScript用户自定义类的类名称的代码
2007/03/08 Javascript
去掉gridPanel表头全选框的小例子
2013/07/18 Javascript
js 限制input只能输入数字、字母和汉字等等
2013/12/18 Javascript
jQuery简单实现仿京东商城的左侧菜单效果代码
2015/09/09 Javascript
超精准的javascript验证身份证号的具体实现方法
2015/11/18 Javascript
JS函数的几种定义方式分析
2015/12/17 Javascript
基于JavaScript短信验证码如何实现
2016/01/24 Javascript
常用的javascript设计模式
2017/01/11 Javascript
浅谈JS验证表单文本域输入空格的问题
2017/02/14 Javascript
jQuery实现左右滑动的toggle方法
2018/03/03 jQuery
vue使用Font Awesome的方法步骤
2019/02/26 Javascript
JavaScript实现网页动态生成表格
2020/11/25 Javascript
[02:41]DOTA2英雄基础教程 谜团
2013/12/10 DOTA
Python中使用HTMLParser解析html实例
2015/02/08 Python
Python实现向服务器请求压缩数据及解压缩数据的方法示例
2017/06/09 Python
python+pandas生成指定日期和重采样的方法
2018/04/11 Python
python使用thrift教程的方法示例
2019/03/21 Python
html5/css3响应式页面开发总结
2018/10/16 HTML / CSS
Sofmap官网:日本著名的数码电器专卖店
2017/05/19 全球购物
Android面试题及答案
2015/09/04 面试题
如何写一个自定义标签
2012/12/28 面试题
工程测量与监理专业应届生求职信
2013/11/27 职场文书
给老婆的搞笑检讨书
2014/01/12 职场文书
新员工考核评语
2014/12/31 职场文书
安全保证书怎么写
2015/02/28 职场文书
大学毕业论文致谢词
2015/05/14 职场文书
复兴之路纪录片观后感
2015/06/02 职场文书
大学生入党自我鉴定范文
2019/06/21 职场文书
90行Python代码开发个人云盘应用
2021/04/20 Python
Python内置数据类型中的集合详解
2022/03/18 Python