详解python 爬取12306验证码


Posted in Python onMay 10, 2019

一个简单的验证码爬取程序

本文介绍了在Python2.7环境下爬取网站验证码:

思路就是获取验证码对应的url,然后发起requst请求,读取该URL对应的内容,然后写入到一个本地文件,实现一个验证码的保存。大量下载可以把以上程序写入一个死循环

代码实现部分:

import ssl
import urllib2
i=1
import time
while(1):

 #不加的话,无法访问12306 
  ssl._create_default_https_context = ssl._create_unverified_context
  # headers = {"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.95 Safari/537.36"}
  # req = urllib2.Request("http://211.87.155.19/(yfsvlfreem4d0b553vkfzfzt)/CheckCode.aspx", headers=headers)
  # https: // www.zhihu.com / captcha.gif?r = 1495351271125 & type = login
  req = urllib2.Request("https://kyfw.12306.cn/otn/passcodeNew/getPassCodeNew?module=login&rand=sjrand&0.7174227166135074")
  u=urllib2.urlopen(req)
  data = u.read()
  f = open("C:/Users/123/Desktop/4/"+str(i)+".jpg",'wb')
  print i
  # time.sleep(1)#有时需要加延时,以防被封。
  i=i+1
  f.write(data)
  f.close()

以下就是爬取的照片的截图

详解python 爬取12306验证码

12306的验证码经常让人眼花缭乱,眼睛仔细看也不能100%的对,算是验证码中比较难是别的。一般由八幅图和一个问题组成,而且图片大小位置固定,问题的位置也是固定的,这也稍微降低了识别的难度。八幅图中一般有两幅图是同一物体,有一个和它比较像。不过有一点暂时没法确定,就是样本库到底有多大,或者说是到底有多少个类别,如果进行训练的话,我们必须获取每个类别个的一定数量的图片作为样本。

以上所述是小编给大家介绍的python爬取12306验证码详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python在信息学竞赛中的运用及Python的基本用法(详解)
Aug 15 Python
python实现批量修改文件名代码
Sep 10 Python
Python探索之实现一个简单的HTTP服务器
Oct 28 Python
python实现将文件夹内的每张图片批量分割成多张
Jul 22 Python
Python Web静态服务器非堵塞模式实现方法示例
Nov 21 Python
Python+OpenCV+图片旋转并用原底色填充新四角的例子
Dec 12 Python
利用Python代码实现一键抠背景功能
Dec 29 Python
推荐8款常用的Python GUI图形界面开发框架
Feb 23 Python
Python3开发实例之非关系型图数据库Neo4j安装方法及Python3连接操作Neo4j方法实例
Mar 18 Python
Python3操作YAML文件格式方法解析
Apr 10 Python
Python基于爬虫实现全网搜索并下载音乐
Feb 14 Python
Python Selenium异常处理的实例分析
Feb 28 Python
详解用python写一个抽奖程序
May 10 #Python
python实现小球弹跳效果
May 10 #Python
基于python实现百度翻译功能
May 09 #Python
python使用time、datetime返回工作日列表实例代码
May 09 #Python
python 对字典按照value进行排序的方法
May 09 #Python
使用Django开发简单接口实现文章增删改查
May 09 #Python
python GUI实现小球满屏乱跑效果
May 09 #Python
You might like
DSP接收机前端设想
2021/03/02 无线电
怎样才能成为PHP高手?学会“懒惰”的编程
2006/12/05 PHP
析构函数与php的垃圾回收机制详解
2013/10/28 PHP
Laravel 5.5 实现禁用用户注册示例
2019/10/24 PHP
Underscore.js 的模板功能介绍与应用
2012/12/24 Javascript
JS 对输入框进行限制(常用的都有)
2013/07/30 Javascript
JS实用的动画弹出层效果实例
2015/05/05 Javascript
如何使用jquery easyui创建标签组件
2015/11/18 Javascript
JS实现类似51job上的地区选择效果示例
2016/11/17 Javascript
javascript设计模式之Adapter模式【适配器模式】实现方法示例
2017/01/13 Javascript
Javascript下拉刷新的简单实现
2017/02/14 Javascript
javascript事件的传播基础实例讲解(35)
2017/02/14 Javascript
JS实现unicode和UTF-8之间的互相转换互转
2017/07/05 Javascript
浅谈js的解析顺序 作用域 严格模式
2017/10/23 Javascript
解决vuecli3.0热更新失效的问题
2018/09/19 Javascript
详解Vue-axios 设置请求头问题
2018/12/06 Javascript
JavaScript事件循环及宏任务微任务原理解析
2020/09/02 Javascript
Python连接mssql数据库编码问题解决方法
2015/01/01 Python
使用Python编写基于DHT协议的BT资源爬虫
2016/03/19 Python
Python3连接MySQL(pymysql)模拟转账实现代码
2016/05/24 Python
Python基于辗转相除法求解最大公约数的方法示例
2018/04/04 Python
Python 使用 PyMysql、DBUtils 创建连接池提升性能
2019/08/14 Python
浅谈Python中re.match()和re.search()的使用及区别
2020/04/14 Python
selenium+python实现基本自动化测试的示例代码
2021/01/27 Python
纯css3(无图片/js)制作的几个社交媒体网站的图标
2013/03/21 HTML / CSS
英国领先的露营和露营车品牌之一:OLPRO
2019/08/06 全球购物
介绍一下Make? 为什么使用make
2013/12/08 面试题
大学生个人自我鉴定
2013/12/03 职场文书
大学生军训广播稿
2014/01/24 职场文书
喷漆工的岗位职责
2014/03/17 职场文书
教师先进工作者事迹材料
2014/05/01 职场文书
整改报告格式
2014/11/06 职场文书
现实表现材料范文
2014/12/23 职场文书
返乡农民工证明
2015/06/24 职场文书
2019新员工试用期转正工作总结范文
2019/08/21 职场文书
导游词之澳门玫瑰圣母堂
2019/12/03 职场文书