详解python 爬取12306验证码


Posted in Python onMay 10, 2019

一个简单的验证码爬取程序

本文介绍了在Python2.7环境下爬取网站验证码:

思路就是获取验证码对应的url,然后发起requst请求,读取该URL对应的内容,然后写入到一个本地文件,实现一个验证码的保存。大量下载可以把以上程序写入一个死循环

代码实现部分:

import ssl
import urllib2
i=1
import time
while(1):

 #不加的话,无法访问12306 
  ssl._create_default_https_context = ssl._create_unverified_context
  # headers = {"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.95 Safari/537.36"}
  # req = urllib2.Request("http://211.87.155.19/(yfsvlfreem4d0b553vkfzfzt)/CheckCode.aspx", headers=headers)
  # https: // www.zhihu.com / captcha.gif?r = 1495351271125 & type = login
  req = urllib2.Request("https://kyfw.12306.cn/otn/passcodeNew/getPassCodeNew?module=login&rand=sjrand&0.7174227166135074")
  u=urllib2.urlopen(req)
  data = u.read()
  f = open("C:/Users/123/Desktop/4/"+str(i)+".jpg",'wb')
  print i
  # time.sleep(1)#有时需要加延时,以防被封。
  i=i+1
  f.write(data)
  f.close()

以下就是爬取的照片的截图

详解python 爬取12306验证码

12306的验证码经常让人眼花缭乱,眼睛仔细看也不能100%的对,算是验证码中比较难是别的。一般由八幅图和一个问题组成,而且图片大小位置固定,问题的位置也是固定的,这也稍微降低了识别的难度。八幅图中一般有两幅图是同一物体,有一个和它比较像。不过有一点暂时没法确定,就是样本库到底有多大,或者说是到底有多少个类别,如果进行训练的话,我们必须获取每个类别个的一定数量的图片作为样本。

以上所述是小编给大家介绍的python爬取12306验证码详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
python进阶教程之文本文件的读取和写入
Aug 29 Python
Python面向对象特殊成员
Apr 24 Python
numpy.random.seed()的使用实例解析
Feb 03 Python
Python编程中NotImplementedError的使用方法
Apr 21 Python
windows下python 3.6.4安装配置图文教程
Aug 21 Python
Python高级特性切片(Slice)操作详解
Sep 27 Python
pandas计数 value_counts()的使用
Jun 24 Python
python分数表示方式和写法
Jun 26 Python
python自定义时钟类、定时任务类
Feb 22 Python
Django项目uwsgi+Nginx保姆级部署教程实现
Apr 19 Python
如何在Python项目中引入日志
May 31 Python
python读取并查看npz/npy文件数据以及数据显示方法
Apr 14 Python
详解用python写一个抽奖程序
May 10 #Python
python实现小球弹跳效果
May 10 #Python
基于python实现百度翻译功能
May 09 #Python
python使用time、datetime返回工作日列表实例代码
May 09 #Python
python 对字典按照value进行排序的方法
May 09 #Python
使用Django开发简单接口实现文章增删改查
May 09 #Python
python GUI实现小球满屏乱跑效果
May 09 #Python
You might like
php获取bing每日壁纸示例分享
2014/02/25 PHP
php封装的pdo数据库操作工具类与用法示例
2019/05/08 PHP
PHP数组array类常见操作示例
2020/05/15 PHP
Nigma vs Alliance BO5 第一场2.14
2021/03/10 DOTA
客户端脚本中常常出现的一些问题和调试技巧
2007/01/09 Javascript
js 日期比较相关天数代码
2014/04/02 Javascript
javascript版的in_array函数(判断数组中是否存在特定值)
2014/05/09 Javascript
JS实现同一个网页布局滑动门和TAB选项卡实例
2015/09/23 Javascript
JavaScript实现Base64编码转换
2016/04/23 Javascript
js中最容易被忽视的事件问题大总结
2016/05/15 Javascript
jQuery 3.0中存在问题及解决办法
2016/07/15 Javascript
微信小程序 实现tabs选项卡效果实例代码
2016/10/31 Javascript
用js屏蔽被http劫持的浮动广告实现方法
2017/08/10 Javascript
详解Node.js利用node-git-server快速搭建git服务器
2017/09/27 Javascript
vue组件中使用props传递数据的实例详解
2018/04/08 Javascript
checkbox在vue中的用法小结
2018/11/13 Javascript
原生js实现移动端Touch轮播图的方法步骤
2019/01/03 Javascript
Python运算符重载用法实例分析
2015/06/01 Python
PyQt5 QSerialPort子线程操作的实现
2018/04/21 Python
python实现多进程代码示例
2018/10/31 Python
python暴力解压rar加密文件过程详解
2019/07/05 Python
Python环境Pillow( PIL )图像处理工具使用解析
2019/09/12 Python
Python 经典算法100及解析(小结)
2019/09/13 Python
python的faker库用法
2019/11/28 Python
Python PIL库图片灰化处理
2020/04/07 Python
pycharm导入源码的具体步骤
2020/08/04 Python
解决Python 写文件报错TypeError的问题
2020/10/23 Python
固特异美国在线轮胎店:Goodyear Tire
2019/02/23 全球购物
JoJo Maman Bébé爱尔兰官网:英国最受欢迎的精品母婴品牌
2020/12/20 全球购物
迎八一活动主题
2014/01/31 职场文书
竞选学习委员演讲稿
2014/04/28 职场文书
五水共治捐款倡议书
2014/05/14 职场文书
幼儿园2015年度工作总结
2015/04/01 职场文书
公司放假通知范文
2015/04/14 职场文书
2015年妇联工作总结范文
2015/04/22 职场文书
周一问候语大全
2015/11/10 职场文书