Python数据抓取爬虫代理防封IP方法


Posted in Python onDecember 23, 2018

爬虫:一段自动抓取互联网信息的程序,从互联网上抓取对于我们有价值的信息,一般来说,Python爬虫程序很多时候都要使用(飞猪IP)代理的IP地址来爬取程序,但是默认的urlopen是无法使用代理的IP的,我就来分享一下Python爬虫怎样使用代理IP的经验。(推荐飞猪代理IP注册可免费使用,浏览器搜索可找到)

Python数据抓取爬虫代理防封IP方法

1、划重点,小编我用的是Python3哦,所以要导入urllib的request,然后我们调用ProxyHandler,它可以接收代理IP的参数。代理可以根据自己需要选择,当然免费的也是有的,但是可用率可想而知的。(飞猪IP)

Python数据抓取爬虫代理防封IP方法

2、接着把IP地址以字典的形式放入其中,这个IP地址是我乱写的,只是用来举例。设置键为http,当然有些是https的,然后后面就是IP地址以及端口号(9000),具体看你的IP地址是什么类型的,不同IP端口号可能不同根据你在飞猪提取的端口为准。

Python数据抓取爬虫代理防封IP方法

3、接着再用build_opener()来构建一个opener对象。

Python数据抓取爬虫代理防封IP方法

4、然后调用构建好的opener对象里面的open方法来发生请求。实际上urlopen也是类似这样使用内部定义好的opener.open(),这里就相当于我们自己重写。

Python数据抓取爬虫代理防封IP方法

5、当然了,如果我们使用install_opener(),就可以把之前自定义的opener设置成全局的。

Python数据抓取爬虫代理防封IP方法

6、设置成全局之后,如果我们再使用urlopen来发送请求,那么发送请求使用的IP地址就是代理IP,而不是本机的IP地址了。

Python数据抓取爬虫代理防封IP方法

7、最后再来说说使用代理遇到的错误,提示目标计算机积极拒绝,这就说明可能是代理IP无效,或者端口号错误,这就需要使用有效的IP才行哦。(这边现在是乱填写的IP地址)可选择飞猪的代理IP。

Python数据抓取爬虫代理防封IP方法

总结:以上就是本次关于Python数据抓取爬虫代理防封IP方法,感谢大家的阅读和对三水点靠木的支持。

Python 相关文章推荐
Python 实现购物商城,含有用户入口和商家入口的示例
Sep 15 Python
Python实现破解猜数游戏算法示例
Sep 25 Python
详谈python在windows中的文件路径问题
Apr 28 Python
python实现抖音点赞功能
Apr 07 Python
python保存字典和读取字典的实例代码
Jul 07 Python
python的常见矩阵运算(小结)
Aug 07 Python
python利用itertools生成密码字典并多线程撞库破解rar密码
Aug 12 Python
python每天定时运行某程序代码
Aug 16 Python
对tensorflow中的strides参数使用详解
Jan 04 Python
windows10 pycharm下安装pyltp库和加载模型实现语义角色标注的示例代码
May 07 Python
Python环境使用OpenCV检测人脸实现教程
Oct 19 Python
教你怎么用python爬取爱奇艺热门电影
May 20 Python
python3爬虫怎样构建请求header
Dec 23 #Python
windows下搭建python scrapy爬虫框架步骤
Dec 23 #Python
python构建基础的爬虫教学
Dec 23 #Python
Flask之请求钩子的实现
Dec 23 #Python
python爬虫获取新浪新闻教学
Dec 23 #Python
Python爬虫文件下载图文教程
Dec 23 #Python
python爬虫获取百度首页内容教学
Dec 23 #Python
You might like
PHP简洁函数(PHP简单明了函数语法)
2012/06/10 PHP
php获取域名的google收录示例
2014/03/24 PHP
PHP MPDF中文乱码的解决方式
2015/12/08 PHP
php+html5+ajax实现上传图片的方法
2016/05/14 PHP
PHP中创建和编辑Excel表格的方法
2018/09/13 PHP
php成功操作redis cluster集群的实例教程
2019/01/13 PHP
奉献给JavaScript初学者的编写开发的七个细节
2011/01/11 Javascript
js计算字符串长度包含的中文是utf8格式
2013/10/15 Javascript
js的Prototype属性解释及常用方法
2014/05/08 Javascript
js使用正则实现ReplaceAll全部替换的方法
2014/08/22 Javascript
使用Plupload实现直接上传附件至七牛云存储
2014/12/26 Javascript
javascript模拟评分控件实现方法
2015/05/13 Javascript
javascript删除元素节点removeChild()用法实例
2015/05/26 Javascript
javascript实现密码验证
2015/11/10 Javascript
基于jQuery实现鼠标点击导航菜单水波动画效果附源码下载
2016/01/06 Javascript
JS实现页面跳转参数不丢失的方法
2016/11/28 Javascript
开源免费天气预报接口API及全国所有地区代码(国家气象局提供)
2016/12/26 Javascript
JS简单获取当前年月日星期的方法示例
2017/02/07 Javascript
js实现图片左右滚动效果
2017/02/27 Javascript
微信小程序页面传值实例分析
2017/04/19 Javascript
微信小程序云开发如何使用npm安装依赖
2019/05/18 Javascript
layui自己添加图片按钮并点击跳转页面的例子
2019/09/14 Javascript
jQuery/JS监听input输入框值变化实例
2019/10/17 jQuery
解决vue更新路由router-view复用组件内容不刷新的问题
2019/11/04 Javascript
jQuery实现聊天对话框
2020/02/08 jQuery
js构造函数constructor和原型prototype原理与用法实例分析
2020/03/02 Javascript
vue实现打地鼠小游戏
2020/08/21 Javascript
vue 动态组件(component :is) 和 dom元素限制(is)用法说明
2020/09/04 Javascript
Python中使用PIL库实现图片高斯模糊实例
2015/02/08 Python
Python对数据库操作
2016/03/28 Python
python对日志进行处理的实例代码
2018/10/06 Python
使用 Python 写一个简易的抽奖程序
2019/12/08 Python
浅谈pytorch 模型 .pt, .pth, .pkl的区别及模型保存方式
2020/05/25 Python
python中执行smtplib失败的处理方法
2020/07/01 Python
HTML5打开本地app应用的方法
2016/03/31 HTML / CSS
Oracle 死锁的检测查询及处理
2021/09/25 Oracle