详解python 爬取12306验证码


Posted in Python onMay 10, 2019

一个简单的验证码爬取程序

本文介绍了在Python2.7环境下爬取网站验证码:

思路就是获取验证码对应的url,然后发起requst请求,读取该URL对应的内容,然后写入到一个本地文件,实现一个验证码的保存。大量下载可以把以上程序写入一个死循环

代码实现部分:

import ssl
import urllib2
i=1
import time
while(1):

 #不加的话,无法访问12306 
  ssl._create_default_https_context = ssl._create_unverified_context
  # headers = {"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.95 Safari/537.36"}
  # req = urllib2.Request("http://211.87.155.19/(yfsvlfreem4d0b553vkfzfzt)/CheckCode.aspx", headers=headers)
  # https: // www.zhihu.com / captcha.gif?r = 1495351271125 & type = login
  req = urllib2.Request("https://kyfw.12306.cn/otn/passcodeNew/getPassCodeNew?module=login&rand=sjrand&0.7174227166135074")
  u=urllib2.urlopen(req)
  data = u.read()
  f = open("C:/Users/123/Desktop/4/"+str(i)+".jpg",'wb')
  print i
  # time.sleep(1)#有时需要加延时,以防被封。
  i=i+1
  f.write(data)
  f.close()

以下就是爬取的照片的截图

详解python 爬取12306验证码

12306的验证码经常让人眼花缭乱,眼睛仔细看也不能100%的对,算是验证码中比较难是别的。一般由八幅图和一个问题组成,而且图片大小位置固定,问题的位置也是固定的,这也稍微降低了识别的难度。八幅图中一般有两幅图是同一物体,有一个和它比较像。不过有一点暂时没法确定,就是样本库到底有多大,或者说是到底有多少个类别,如果进行训练的话,我们必须获取每个类别个的一定数量的图片作为样本。

以上所述是小编给大家介绍的python爬取12306验证码详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python实现更改图片尺寸大小的方法(基于Pillow包)
Sep 19 Python
Python操作MySQL数据库的方法
Jun 20 Python
python爬取微信公众号文章
Aug 31 Python
python 用for循环实现1~n求和的实例
Feb 01 Python
pandas修改DataFrame列名的实现方法
Feb 22 Python
python中pygame安装过程(超级详细)
Aug 04 Python
python selenium循环登陆网站的实现
Nov 04 Python
Python中的wordcloud库安装问题及解决方法
May 27 Python
Kears 使用:通过回调函数保存最佳准确率下的模型操作
Jun 17 Python
解决pip install psycopg2出错问题
Jul 09 Python
Kmeans均值聚类算法原理以及Python如何实现
Sep 26 Python
Selenium+BeautifulSoup+json获取Script标签内的json数据
Dec 07 Python
详解用python写一个抽奖程序
May 10 #Python
python实现小球弹跳效果
May 10 #Python
基于python实现百度翻译功能
May 09 #Python
python使用time、datetime返回工作日列表实例代码
May 09 #Python
python 对字典按照value进行排序的方法
May 09 #Python
使用Django开发简单接口实现文章增删改查
May 09 #Python
python GUI实现小球满屏乱跑效果
May 09 #Python
You might like
聊天室php&mysql(三)
2006/10/09 PHP
php表单转换textarea换行符的方法
2010/09/10 PHP
PHP读取数据库并按照中文名称进行排序实现代码
2013/01/29 PHP
浅谈web上存漏洞及原理分析、防范方法(文件名检测漏洞)
2013/06/29 PHP
PHP中数据类型转换的三种方式
2015/04/02 PHP
Nginx下配置codeigniter框架方法
2015/04/07 PHP
PHP 文件上传后端处理实用技巧方法
2017/01/06 PHP
JavaScript获取FCK编辑器信息的具体方法
2013/07/12 Javascript
B/S模式项目中常用的javascript汇总
2013/12/17 Javascript
快速解决jquery之get缓存问题的最简单方法介绍
2013/12/19 Javascript
jQuery.parseJSON(json)将JSON字符串转换成js对象
2014/07/27 Javascript
jQuery实现的鼠标经过时变宽的效果(附demo源码)
2016/04/28 Javascript
使用微信内嵌H5网页解决JS倒计时失效问题
2017/01/13 Javascript
jQuery布局组件EasyUI Layout使用方法详解
2017/02/28 Javascript
详解javascript 正则表达式之分组与前瞻匹配
2018/05/30 Javascript
如何对react hooks进行单元测试的方法
2019/08/14 Javascript
JavaScript装饰者模式原理与用法实例详解
2020/03/09 Javascript
Python爬虫抓取手机APP的传输数据
2016/01/22 Python
Python实现处理逆波兰表达式示例
2018/07/30 Python
Python3远程监控程序的实现方法
2019/07/15 Python
Python OpenCV实现鼠标画框效果
2020/08/19 Python
matlab灰度图像调整及imadjust函数的用法详解
2020/02/27 Python
Python MySQL 日期时间格式化作为参数的操作
2020/03/02 Python
python神经网络编程实现手写数字识别
2020/05/27 Python
Pytorch框架实现mnist手写库识别(与tensorflow对比)
2020/07/20 Python
基于python实现坦克大战游戏
2020/10/27 Python
Shopping happy life西班牙:以最优惠的价格提供最好的时尚配饰
2020/03/13 全球购物
文明青少年标兵事迹材料
2014/01/28 职场文书
户外婚礼策划方案
2014/02/08 职场文书
资金主管岗位职责范本
2014/03/04 职场文书
优秀乡村医生先进事迹材料
2014/08/23 职场文书
普通党员个人对照检查材料
2014/09/18 职场文书
党支部班子“四风”问题自我剖析材料
2014/09/28 职场文书
2014年社区民政工作总结
2014/12/02 职场文书
Spring中的@Transactional的工作原理
2022/06/05 Java/Android
Android移动应用开发指南之六种布局详解
2022/09/23 Java/Android