Python数据抓取爬虫代理防封IP方法


Posted in Python onDecember 23, 2018

爬虫:一段自动抓取互联网信息的程序,从互联网上抓取对于我们有价值的信息,一般来说,Python爬虫程序很多时候都要使用(飞猪IP)代理的IP地址来爬取程序,但是默认的urlopen是无法使用代理的IP的,我就来分享一下Python爬虫怎样使用代理IP的经验。(推荐飞猪代理IP注册可免费使用,浏览器搜索可找到)

Python数据抓取爬虫代理防封IP方法

1、划重点,小编我用的是Python3哦,所以要导入urllib的request,然后我们调用ProxyHandler,它可以接收代理IP的参数。代理可以根据自己需要选择,当然免费的也是有的,但是可用率可想而知的。(飞猪IP)

Python数据抓取爬虫代理防封IP方法

2、接着把IP地址以字典的形式放入其中,这个IP地址是我乱写的,只是用来举例。设置键为http,当然有些是https的,然后后面就是IP地址以及端口号(9000),具体看你的IP地址是什么类型的,不同IP端口号可能不同根据你在飞猪提取的端口为准。

Python数据抓取爬虫代理防封IP方法

3、接着再用build_opener()来构建一个opener对象。

Python数据抓取爬虫代理防封IP方法

4、然后调用构建好的opener对象里面的open方法来发生请求。实际上urlopen也是类似这样使用内部定义好的opener.open(),这里就相当于我们自己重写。

Python数据抓取爬虫代理防封IP方法

5、当然了,如果我们使用install_opener(),就可以把之前自定义的opener设置成全局的。

Python数据抓取爬虫代理防封IP方法

6、设置成全局之后,如果我们再使用urlopen来发送请求,那么发送请求使用的IP地址就是代理IP,而不是本机的IP地址了。

Python数据抓取爬虫代理防封IP方法

7、最后再来说说使用代理遇到的错误,提示目标计算机积极拒绝,这就说明可能是代理IP无效,或者端口号错误,这就需要使用有效的IP才行哦。(这边现在是乱填写的IP地址)可选择飞猪的代理IP。

Python数据抓取爬虫代理防封IP方法

总结:以上就是本次关于Python数据抓取爬虫代理防封IP方法,感谢大家的阅读和对三水点靠木的支持。

Python 相关文章推荐
一篇不错的Python入门教程
Feb 08 Python
Python列表(list)常用操作方法小结
Feb 02 Python
在Python的while循环中使用else以及循环嵌套的用法
Oct 14 Python
Python cookbook(数据结构与算法)实现优先级队列的方法示例
Feb 18 Python
Python爬取数据保存为Json格式的代码示例
Apr 09 Python
如何在Python中实现goto语句的方法
May 18 Python
vscode 配置 python3开发环境的方法
Sep 19 Python
在pandas中遍历DataFrame行的实现方法
Oct 23 Python
Python之指数与E记法的区别详解
Nov 21 Python
Python Numpy数组扩展repeat和tile使用实例解析
Dec 09 Python
python itsdangerous模块的具体使用方法
Feb 17 Python
python实现简易名片管理系统
Apr 11 Python
python3爬虫怎样构建请求header
Dec 23 #Python
windows下搭建python scrapy爬虫框架步骤
Dec 23 #Python
python构建基础的爬虫教学
Dec 23 #Python
Flask之请求钩子的实现
Dec 23 #Python
python爬虫获取新浪新闻教学
Dec 23 #Python
Python爬虫文件下载图文教程
Dec 23 #Python
python爬虫获取百度首页内容教学
Dec 23 #Python
You might like
这部好评如潮的动漫 知名梗频出 但是画风劝退很多人
2020/03/08 日漫
PHP MemCached 高级缓存应用代码
2010/08/05 PHP
PHP排序之二维数组的按照字母排序实现代码
2011/08/13 PHP
CI框架中集成CKEditor编辑器的教程
2014/06/09 PHP
浅谈PHP正则表达式中修饰符/i, /is, /s, /isU
2014/10/21 PHP
PHP cURL初始化和执行方法入门级代码
2015/05/28 PHP
js jquery做的图片连续滚动代码
2008/01/06 Javascript
初学js 新节点的创建 删除 的步骤
2011/07/04 Javascript
javascript实现日期时间动态显示示例代码
2015/09/08 Javascript
基于jQuery实现点击弹出层实例代码
2016/01/01 Javascript
深入理解JavaScript定时机制
2016/10/27 Javascript
JS实现重新加载当前页面
2016/11/29 Javascript
js实现横向拖拽导航条功能
2017/02/17 Javascript
bootstrap multiselect 多选功能实现方法
2017/06/05 Javascript
jquery实现图片放大点击切换
2017/06/06 jQuery
JS实现评价的星星功能
2017/08/20 Javascript
微信小程序实现全国机场索引列表
2018/01/31 Javascript
Python 使用requests模块发送GET和POST请求的实现代码
2016/09/21 Python
PyQt5+Caffe+Opencv搭建人脸识别登录界面
2019/08/28 Python
Django使用uwsgi部署时的配置以及django日志文件的处理方法
2019/08/30 Python
python super函数使用方法详解
2020/02/14 Python
将keras的h5模型转换为tensorflow的pb模型操作
2020/05/25 Python
如何基于Python爬取隐秘的角落评论
2020/07/02 Python
详解使用python爬取抖音app视频(appium可以操控手机)
2021/01/26 Python
CSS3教程(8):CSS3透明度指南
2009/04/02 HTML / CSS
会走动的图形html5时钟示例
2014/04/27 HTML / CSS
荷兰多品牌网上鞋店:Stoute Schoenen
2017/08/24 全球购物
Radley英国官网:英国莱德利小狗包
2019/03/21 全球购物
意大利在线高尔夫商店:Online Golf
2021/03/09 全球购物
大学毕业登记表自我鉴定
2013/10/09 职场文书
中学生个人自我评价
2014/02/06 职场文书
广播节目策划方案
2014/05/23 职场文书
机械专业技术员求职信
2014/06/14 职场文书
工作求职信
2014/07/04 职场文书
工地材料员岗位职责
2015/04/11 职场文书
python之PySide2安装使用及QT Designer UI设计案例教程
2021/07/26 Python