python3 破解 geetest(极验)的滑块验证码功能


Posted in Python onFebruary 24, 2018

下面一段代码给大家介绍python破解geetest 验证码功能,具体代码如下所示:

from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.common.action_chains import ActionChains
import PIL.Image as image
import time,re, random
import requests
try:
  from StringIO import StringIO
except ImportError:
  from io import StringIO

#爬虫模拟的浏览器头部信息
agent = 'Mozilla/5.0 (Windows NT 5.1; rv:33.0) Gecko/20100101 Firefox/33.0'
headers = {
    'User-Agent': agent
    }

# 根据位置对图片进行合并还原
# filename:图片
# location_list:图片位置
#内部两个图片处理函数的介绍
#crop函数带的参数为(起始点的横坐标,起始点的纵坐标,宽度,高度)
#paste函数的参数为(需要修改的图片,粘贴的起始点的横坐标,粘贴的起始点的纵坐标)
def get_merge_image(filename,location_list):
  #打开图片文件
  im = image.open(filename)
  #创建新的图片,大小为260*116
  new_im = image.new('RGB', (260,116))
  im_list_upper=[]
  im_list_down=[]
  # 拷贝图片
  for location in location_list:
    #上面的图片
    if location['y']==-58:
      im_list_upper.append(im.crop((abs(location['x']),58,abs(location['x'])+10,166)))
    #下面的图片
    if location['y']==0:
      im_list_down.append(im.crop((abs(location['x']),0,abs(location['x'])+10,58)))
  new_im = image.new('RGB', (260,116))
  x_offset = 0
  #黏贴图片
  for im in im_list_upper:
    new_im.paste(im, (x_offset,0))
    x_offset += im.size[0]
  x_offset = 0
  for im in im_list_down:
    new_im.paste(im, (x_offset,58))
    x_offset += im.size[0]
  return new_im

#下载并还原图片
# driver:webdriver
# div:图片的div
def get_image(driver,div):
  #找到图片所在的div
  background_images=driver.find_elements_by_xpath(div)
  location_list=[]
  imageurl=''
  #图片是被CSS按照位移的方式打乱的,我们需要找出这些位移,为后续还原做好准备
  for background_image in background_images:
    location={}
    #在html里面解析出小图片的url地址,还有长高的数值
    location['x']=int(re.findall("background-image: url\(\"(.*)\"\); background-position: (.*)px (.*)px;",background_image.get_attribute('style'))[0][1])
    location['y']=int(re.findall("background-image: url\(\"(.*)\"\); background-position: (.*)px (.*)px;",background_image.get_attribute('style'))[0][2])
    imageurl=re.findall("background-image: url\(\"(.*)\"\); background-position: (.*)px (.*)px;",background_image.get_attribute('style'))[0][0]
    location_list.append(location)
  #替换图片的后缀,获得图片的URL
  imageurl=imageurl.replace("webp","jpg")
  #获得图片的名字
  imageName = imageurl.split('/')[-1]
  #获得图片
  session = requests.session()
  r = session.get(imageurl, headers = headers, verify = False)
  #下载图片
  with open(imageName, 'wb') as f:
    f.write(r.content)
    f.close()
  #重新合并还原图片
  image=get_merge_image(imageName, location_list)
  return image

#对比RGB值
def is_similar(image1,image2,x,y):
  pass
  #获取指定位置的RGB值
  pixel1=image1.getpixel((x,y))
  pixel2=image2.getpixel((x,y))
  for i in range(0,3):
    # 如果相差超过50则就认为找到了缺口的位置
    if abs(pixel1[i]-pixel2[i])>=50:
      return False
  return True

#计算缺口的位置
def get_diff_location(image1,image2):
  i=0
  # 两张原始图的大小都是相同的260*116
  # 那就通过两个for循环依次对比每个像素点的RGB值
  # 如果相差超过50则就认为找到了缺口的位置
  for i in range(0,260):
    for j in range(0,116):
      if is_similar(image1,image2,i,j)==False:
        return i

#根据缺口的位置模拟x轴移动的轨迹
def get_track(length):
  pass
  list=[]
  #间隔通过随机范围函数来获得,每次移动一步或者两步
  x=random.randint(1,3)
  #生成轨迹并保存到list内
  while length-x>=5:
    list.append(x)
    length=length-x
    x=random.randint(1,3)
  #最后五步都是一步步移动
  for i in range(length):
    list.append(1)
  return list

#滑动验证码破解程序
def main():
  #打开火狐浏览器
  driver = webdriver.Firefox()
  #用火狐浏览器打开网页
  driver.get("http://www.geetest.com/exp_embed")
  #等待页面的上元素刷新出来
  WebDriverWait(driver, 30).until(lambda the_driver: the_driver.find_element_by_xpath("//div[@class='gt_slider_knob gt_show']").is_displayed())
  WebDriverWait(driver, 30).until(lambda the_driver: the_driver.find_element_by_xpath("//div[@class='gt_cut_bg gt_show']").is_displayed())
  WebDriverWait(driver, 30).until(lambda the_driver: the_driver.find_element_by_xpath("//div[@class='gt_cut_fullbg gt_show']").is_displayed())
  #下载图片
  image1=get_image(driver, "//div[@class='gt_cut_bg gt_show']/div")
  image2=get_image(driver, "//div[@class='gt_cut_fullbg gt_show']/div")
  #计算缺口位置
  loc=get_diff_location(image1, image2)
  #生成x的移动轨迹点
  track_list=get_track(loc)
  #找到滑动的圆球
  element=driver.find_element_by_xpath("//div[@class='gt_slider_knob gt_show']")
  location=element.location
  #获得滑动圆球的高度
  y=location['y']
  #鼠标点击元素并按住不放
  print ("第一步,点击元素")
  ActionChains(driver).click_and_hold(on_element=element).perform()
  time.sleep(0.15)
  print ("第二步,拖动元素")
  track_string = ""
  for track in track_list:
    #不能移动太快,否则会被认为是程序执行
    track_string = track_string + "{%d,%d}," % (track, y - 445)
    #xoffset=track+22:这里的移动位置的值是相对于滑动圆球左上角的相对值,而轨迹变量里的是圆球的中心点,所以要加上圆球长度的一半。
    #yoffset=y-445:这里也是一样的。不过要注意的是不同的浏览器渲染出来的结果是不一样的,要保证最终的计算后的值是22,也就是圆球高度的一半
    ActionChains(driver).move_to_element_with_offset(to_element=element, xoffset=track+22, yoffset=y-445).perform()
    #间隔时间也通过随机函数来获得,间隔不能太快,否则会被认为是程序执行
    time.sleep(random.randint(10,50)/100)
  print (track_string)
  #xoffset=21,本质就是向后退一格。这里退了5格是因为圆球的位置和滑动条的左边缘有5格的距离
  ActionChains(driver).move_to_element_with_offset(to_element=element, xoffset=21, yoffset=y-445).perform()
  time.sleep(0.1)
  ActionChains(driver).move_to_element_with_offset(to_element=element, xoffset=21, yoffset=y-445).perform()
  time.sleep(0.1)
  ActionChains(driver).move_to_element_with_offset(to_element=element, xoffset=21, yoffset=y-445).perform()
  time.sleep(0.1)
  ActionChains(driver).move_to_element_with_offset(to_element=element, xoffset=21, yoffset=y-445).perform()
  time.sleep(0.1)
  ActionChains(driver).move_to_element_with_offset(to_element=element, xoffset=21, yoffset=y-445).perform()
  print ("第三步,释放鼠标")
  #释放鼠标
  ActionChains(driver).release(on_element=element).perform()
  time.sleep(3)
  #点击验证
  # submit = driver.find_element_by_xpath("//div[@class='gt_ajax_tip success']")
  # print(submit.location)
  # time.sleep(5)
  #关闭浏览器,为了演示方便,暂时注释掉.
  #driver.quit()

#主函数入口
if __name__ == '__main__':
  pass
  main()

总结

以上所述是小编给大家介绍的python3 破解 geetest(极验)的滑块验证码功能,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
python数据库操作常用功能使用详解(创建表/插入数据/获取数据)
Dec 06 Python
Python中利用sorted()函数排序的简单教程
Apr 27 Python
Python实现树莓派WiFi断线自动重连的实例代码
Mar 16 Python
python中实现延时回调普通函数示例代码
Sep 08 Python
python+opencv实现动态物体识别
Jan 09 Python
python pandas时序处理相关功能详解
Jul 03 Python
python os.path.isfile()因参数问题判断错误的解决
Nov 29 Python
Python发起请求提示UnicodeEncodeError错误代码解决方法
Apr 21 Python
使用Python内置模块与函数进行不同进制的数的转换
Apr 26 Python
keras分类模型中的输入数据与标签的维度实例
Jul 03 Python
python中K-means算法基础知识点
Jan 25 Python
python实现简单文件读写函数
Feb 25 Python
python opencv之SURF算法示例
Feb 24 #Python
几种实用的pythonic语法实例代码
Feb 24 #Python
使用Python爬取最好大学网大学排名
Feb 24 #Python
python opencv 直方图反向投影的方法
Feb 24 #Python
python爬虫爬取淘宝商品信息
Feb 23 #Python
python爬取淘宝商品详情页数据
Feb 23 #Python
Python如何抓取天猫商品详细信息及交易记录
Feb 23 #Python
You might like
DC漫画《蝙蝠侠和猫女》图透 猫女怀孕老爷当爹
2020/04/09 欧美动漫
关于BIG5-HKSCS的解决方法
2007/03/20 PHP
常见php数据文件缓存类汇总
2014/12/05 PHP
php两种无限分类方法实例
2015/04/21 PHP
PHP实现过滤各种HTML标签
2015/05/17 PHP
Laravel中任务调度console使用方法小结
2017/05/07 PHP
javascript 屏蔽鼠标键盘的几段代码
2008/01/02 Javascript
浅谈Javascript事件处理程序的几种方式
2012/06/27 Javascript
JQuery调webservice实现邮箱验证(检测是否可用)
2013/05/21 Javascript
javascript实现页面内关键词高亮显示代码
2014/04/03 Javascript
JQuery的Ajax中Post方法传递中文出现乱码的解决方法
2014/10/21 Javascript
bootstrap改变按钮加载状态
2014/12/01 Javascript
jQuery简单实现两级下拉菜单效果代码
2015/09/15 Javascript
jQuery提示插件qTip2用法分析(支持ajax及多种样式)
2016/06/08 Javascript
js中scrollTop()方法和scroll()方法用法示例
2016/10/03 Javascript
JavaScript ES6中CLASS的使用详解
2016/11/22 Javascript
微信小程序 循环及嵌套循环的使用总结
2017/09/26 Javascript
JavaScript this使用方法图解
2020/02/04 Javascript
通过实例了解Javascript柯里化流程
2020/03/03 Javascript
跟老齐学Python之dict()的操作方法
2014/09/24 Python
使用Python设计一个代码统计工具
2018/04/04 Python
将python代码和注释分离的方法
2018/04/21 Python
用python打印菱形的实操方法和代码
2019/06/25 Python
python 使用matplotlib 实现从文件中读取x,y坐标的可视化方法
2019/07/04 Python
Python定时任务APScheduler的实例实例详解
2019/07/22 Python
Python爬虫设置ip代理过程解析
2020/07/20 Python
Python 如何调试程序崩溃错误
2020/08/03 Python
购买200个世界上最好的内衣品牌:Bare Necessities
2017/02/11 全球购物
Bally巴利英国官网:经典瑞士鞋履、手袋及配饰奢侈品牌
2018/05/07 全球购物
拾金不昧表扬信范文
2014/01/11 职场文书
职工运动会感言
2014/02/07 职场文书
优质服务演讲稿
2014/05/14 职场文书
班级学雷锋活动总结
2014/06/26 职场文书
小学班主任经验交流材料
2014/12/16 职场文书
唱歌比赛拉拉队口号
2015/12/25 职场文书
mysql外连接与内连接查询的不同之处
2021/06/03 MySQL