python+selenium识别验证码并登录的示例代码


Posted in Python onDecember 21, 2017

由于工作需要,登录网站需要用到验证码。最初是研究过验证码识别的,但是总是不能获取到我需要的那个验证码。直到这周五,才想起这事来,昨天顺利的解决了。

下面正题:

python版本:3.4.3

所需要的代码库:PIL,selenium,tesseract

先上代码:

#coding:utf-8
import subprocess
from PIL import Image
from PIL import ImageOps
from selenium import webdriver
import time,os,sys
def cleanImage(imagePath):
  image = Image.open(imagePath)  #打开图片
  image = image.point(lambda x: 0 if x<143 else 255) #处理图片上的每个像素点,使图片上每个点“非黑即白”
  borderImage = ImageOps.expand(image,border=20,fill='white')
  borderImage.save(imagePath)

def getAuthCode(driver, url="http://localhost/"):
  captchaUrl = url + "common/random"
  driver.get(captchaUrl) 
  time.sleep(0.5)
  driver.save_screenshot("captcha.jpg")  #截屏,并保存图片
  #urlretrieve(captchaUrl, "captcha.jpg")
  time.sleep(0.5)
  cleanImage("captcha.jpg")
  p = subprocess.Popen(["tesseract", "captcha.jpg", "captcha"], stdout=\
             subprocess.PIPE,stderr=subprocess.PIPE)
  p.wait()
  f = open("captcha.txt", "r")
  
  #Clean any whitespace characters
  captchaResponse = f.read().replace(" ", "").replace("\n", "")
  print("Captcha solution attempt: " + captchaResponse)
  if len(captchaResponse) == 4:
    return captchaResponse
  else:
    return False

def withoutCookieLogin(url="http://org.cfu666.com/"):
  driver = webdriver.Chrome()
  driver.maximize_window()
  driver.get(url)
  while True:   
    authCode = getAuthCode(driver, url)
    if authCode:
      driver.back()
      driver.find_element_by_xpath("//input[@id='orgCode' and @name='orgCode']").clear()
      driver.find_element_by_xpath("//input[@id='orgCode' and @name='orgCode']").send_keys("orgCode")
      driver.find_element_by_xpath("//input[@id='account' and @name='username']").clear()
      driver.find_element_by_xpath("//input[@id='account' and @name='username']").send_keys("username")
      driver.find_element_by_xpath("//input[@type='password' and @name='password']").clear()
      driver.find_element_by_xpath("//input[@type='password' and @name='password']").send_keys("password")       
      driver.find_element_by_xpath("//input[@type='text' and @name='authCode']").send_keys(authCode)
      driver.find_element_by_xpath("//button[@type='submit']").click()
      try:
        time.sleep(3)
        driver.find_element_by_xpath("//*[@id='side-menu']/li[2]/ul/li/a").click()
        return driver
      except:
        print("authCode Error:", authCode)
        driver.refresh()
  return driver
driver = withoutCookieLogin("http://localhost/")
driver.get("http://localhost/enterprise/add/")

怎么获取我们需要的验证码

在这获取验证码的道路上,我掉了太多的坑,看过太多的文章,很多都是教你验证码的识别方法,但是没有说明,怎么获取你当前需要的验证码图片。

我的处理方法是:

1.先用selenium打开你需要的登录的页面地址url1

python+selenium识别验证码并登录的示例代码

2.通过审核元素获取验证码的地址url2(其实最简单的是右键打开新页面)

python+selenium识别验证码并登录的示例代码

3:在url1页面,输入地址url2进入url2页面,然后截屏保存验证码页面

python+selenium识别验证码并登录的示例代码

4:处理验证码得到验证码字符串。然后点击浏览器后退按钮,返回url1登录页面

5:输入登录需要的信息和验证码

python+selenium识别验证码并登录的示例代码

6:点击登录

7:验证登录后的页面,判断是否成功,若不成功则需要重新1-7的操作。

为了保护公司的信息,这个页面是我本地搭的服务,我在伯乐在线注册页面进行测试过这个验证码获得方法,可以通过。(这个验证码的处理方法,仅限验证码背景是像素点,若验证码有横线需额外处理。)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python利用elaphe制作二维条形码实现代码
May 25 Python
用python写asp详细讲解
Dec 16 Python
Python中使用logging模块打印log日志详解
Apr 05 Python
python安装cx_Oracle模块常见问题与解决方法
Feb 21 Python
使用Python3制作TCP端口扫描器
Apr 17 Python
Python的装饰器使用详解
Jun 26 Python
详解如何用OpenCV + Python 实现人脸识别
Oct 20 Python
python3实现公众号每日定时发送日报和图片
Feb 24 Python
彻彻底底地理解Python中的编码问题
Oct 15 Python
pandas实现to_sql将DataFrame保存到数据库中
Jul 03 Python
Python开发企业微信机器人每天定时发消息实例
Mar 17 Python
python程序实现BTC(比特币)挖矿的完整代码
Jan 20 Python
python实现随机森林random forest的原理及方法
Dec 21 #Python
python编写分类决策树的代码
Dec 21 #Python
Python基于PyGraphics包实现图片截取功能的方法
Dec 21 #Python
用Python写王者荣耀刷金币脚本
Dec 21 #Python
python使用Apriori算法进行关联性解析
Dec 21 #Python
python实现kMeans算法
Dec 21 #Python
利用Tkinter(python3.6)实现一个简单计算器
Dec 21 #Python
You might like
新浪SAE搭建PHP项目教程
2015/01/28 PHP
关于PHP中协程和阻塞的一些理解与思考
2017/08/11 PHP
js模拟点击事件实现代码
2012/11/06 Javascript
jquery 检测元素是否存在的实例代码
2013/11/19 Javascript
javascript自定义函数参数传递为字符串格式
2014/07/29 Javascript
jQuery Masonry瀑布流插件使用详解
2014/11/17 Javascript
javascript异步编程代码书写规范Promise学习笔记
2015/02/11 Javascript
用瀑布流的方式在网页上插入图片的简单实现方法
2016/09/23 Javascript
vue-cli webpack 开发环境跨域详解
2017/05/18 Javascript
JavaScript变量声明var,let.const及区别浅析
2018/04/23 Javascript
JavaScript偏函数与柯里化实例详解
2019/03/27 Javascript
微信小程序 swiper 组件遇到的问题及解决方法
2019/05/26 Javascript
layui动态渲染生成select的option值方法
2019/09/23 Javascript
简单了解前端渐进式框架VUE
2020/07/20 Javascript
vue+iview实现文件上传
2020/11/17 Vue.js
JS代码实现页面切换效果
2021/01/10 Javascript
Python下的subprocess模块的入门指引
2015/04/16 Python
简单的Apache+FastCGI+Django配置指南
2015/07/22 Python
Python文件夹与文件的相关操作(推荐)
2016/07/25 Python
pip matplotlib报错equired packages can not be built解决
2018/01/06 Python
django 在原有表格添加或删除字段的实例
2018/05/27 Python
对numpy.append()里的axis的用法详解
2018/06/28 Python
python机器学习之KNN分类算法
2018/08/29 Python
python3获取当前目录的实现方法
2019/07/29 Python
python 解决selenium 中的 .clear()方法失效问题
2020/09/01 Python
如何从csv文件构建Tensorflow的数据集
2020/09/21 Python
Pycharm 解决自动格式化冲突的设置操作
2021/01/15 Python
HTML5实现可缩放时钟代码
2017/08/28 HTML / CSS
KIKO比利时官网:意大利彩妆品牌
2017/07/23 全球购物
迪卡侬比利时官网:Decathlon比利时
2019/12/28 全球购物
市场营销大学生职业规划书
2014/02/25 职场文书
大学迎新晚会主持词
2014/03/24 职场文书
大学第二课堂活动总结
2014/07/08 职场文书
报名委托书
2015/01/29 职场文书
CSS 实现多彩、智能的阴影效果
2021/05/12 HTML / CSS
阿里云服务器搭建Php+Apache运行环境的详细过程
2021/05/15 PHP