详解python 爬取12306验证码


Posted in Python onMay 10, 2019

一个简单的验证码爬取程序

本文介绍了在Python2.7环境下爬取网站验证码:

思路就是获取验证码对应的url,然后发起requst请求,读取该URL对应的内容,然后写入到一个本地文件,实现一个验证码的保存。大量下载可以把以上程序写入一个死循环

代码实现部分:

import ssl
import urllib2
i=1
import time
while(1):

 #不加的话,无法访问12306 
  ssl._create_default_https_context = ssl._create_unverified_context
  # headers = {"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.95 Safari/537.36"}
  # req = urllib2.Request("http://211.87.155.19/(yfsvlfreem4d0b553vkfzfzt)/CheckCode.aspx", headers=headers)
  # https: // www.zhihu.com / captcha.gif?r = 1495351271125 & type = login
  req = urllib2.Request("https://kyfw.12306.cn/otn/passcodeNew/getPassCodeNew?module=login&rand=sjrand&0.7174227166135074")
  u=urllib2.urlopen(req)
  data = u.read()
  f = open("C:/Users/123/Desktop/4/"+str(i)+".jpg",'wb')
  print i
  # time.sleep(1)#有时需要加延时,以防被封。
  i=i+1
  f.write(data)
  f.close()

以下就是爬取的照片的截图

详解python 爬取12306验证码

12306的验证码经常让人眼花缭乱,眼睛仔细看也不能100%的对,算是验证码中比较难是别的。一般由八幅图和一个问题组成,而且图片大小位置固定,问题的位置也是固定的,这也稍微降低了识别的难度。八幅图中一般有两幅图是同一物体,有一个和它比较像。不过有一点暂时没法确定,就是样本库到底有多大,或者说是到底有多少个类别,如果进行训练的话,我们必须获取每个类别个的一定数量的图片作为样本。

以上所述是小编给大家介绍的python爬取12306验证码详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python计时相关操作详解【time,datetime】
May 26 Python
python实现图书管理系统
Mar 12 Python
Python3爬虫使用Fidder实现APP爬取示例
Nov 27 Python
python通过tcp发送xml报文的方法
Dec 28 Python
使用Python3内置文档高效学习以及官方中文文档
May 19 Python
python爬虫 基于requests模块发起ajax的get请求实现解析
Aug 20 Python
Python测试线程应用程序过程解析
Dec 31 Python
将python文件打包exe独立运行程序方法详解
Feb 12 Python
浅析Python 条件控制语句
Jul 15 Python
python利用线程实现多任务
Sep 18 Python
python可视化分析的实现(matplotlib、seaborn、ggplot2)
Feb 03 Python
python pygame 愤怒的小鸟游戏示例代码
Feb 25 Python
详解用python写一个抽奖程序
May 10 #Python
python实现小球弹跳效果
May 10 #Python
基于python实现百度翻译功能
May 09 #Python
python使用time、datetime返回工作日列表实例代码
May 09 #Python
python 对字典按照value进行排序的方法
May 09 #Python
使用Django开发简单接口实现文章增删改查
May 09 #Python
python GUI实现小球满屏乱跑效果
May 09 #Python
You might like
PHP对象Object的概念 介绍
2012/06/14 PHP
PHP文件操作详解
2016/12/30 PHP
Yii框架中使用PHPExcel的方法分析
2019/07/25 PHP
js或css实现滚动广告的几种方案
2010/01/28 Javascript
jQuery 通过事件委派一次绑定多种事件,以减少事件冗余
2010/06/30 Javascript
jquery miniui 教程 表格控件 合并单元格应用
2012/11/25 Javascript
Jquery中"$(document).ready(function(){ })"函数的使用详解
2013/12/30 Javascript
js如何判断用户是否是用微信浏览器
2014/06/05 Javascript
用JavaScript动态建立或增加CSS样式表的实现方法
2016/05/20 Javascript
js改变style样式和css样式的简单实例
2016/06/28 Javascript
利用css+原生js制作简单的钟表
2020/04/07 Javascript
jQuery中show与hide方法用法示例
2016/09/16 Javascript
利用Js的console对象,在控制台打印调式信息测试Js的实现
2016/11/26 Javascript
利用Angularjs中模块ui-route管理状态的方法
2016/12/27 Javascript
详解JavaScript树结构
2017/01/09 Javascript
jQuery居中元素scrollleft计算方法示例
2017/01/16 Javascript
js实现颜色阶梯渐变效果(Gradient算法)
2017/03/21 Javascript
详谈js模块化规范
2017/07/07 Javascript
nodejs 如何手动实现服务器
2018/08/20 NodeJs
五分钟搞懂Vuex实用知识(小结)
2019/08/12 Javascript
nuxt+axios实现打包后动态修改请求地址的方法
2020/04/22 Javascript
ant design pro中可控的筛选和排序实例
2020/11/17 Javascript
React服务端渲染原理解析与实践
2021/03/04 Javascript
浅谈Python的垃圾回收机制
2016/12/17 Python
Python tornado队列示例-一个并发web爬虫代码分享
2018/01/09 Python
python爬虫租房信息在地图上显示的方法
2019/05/13 Python
Django之全局使用request.user.username的实例详解
2020/05/14 Python
python中get和post有什么区别
2020/06/19 Python
CSS3截取字符串实例代码【推荐】
2018/06/07 HTML / CSS
文明单位申报材料
2014/12/23 职场文书
学校开除通知书
2015/04/25 职场文书
湘江北去观后感
2015/06/15 职场文书
2015年物业管理员工工作总结
2015/10/15 职场文书
初中数学课堂教学反思
2016/02/17 职场文书
在Windows下安装配置CPU版的PyTorch的方法
2021/04/02 Python
SpringCloud项目如何解决log4j2漏洞
2022/04/10 Java/Android