Python爬虫设置代理IP(图文)


Posted in Python onDecember 23, 2018

在爬虫的过程中,我们经常会遇见很多网站采取了防爬取技术,或者说因为自己采集网站信息的强度和采集速度太大,给对方服务器带去了太多的压力。

如果你一直用同一个代理ip爬取这个网页,很有可能ip会被禁止访问网页,所以基本上做爬虫的都躲不过去ip的问题。

Python爬虫设置代理IP(图文)

1、我们在做爬虫的过程中经常会遇到这样的情况,最初爬虫正常运行,正常爬取数据,一切看起来都是那么美好,然而不久之后可能会出现错误,比如 403 Forbidden,这时候你打开网页一看,可能会看到“您的 IP 访问频率太高”这样的提示。出现这种情况的原因是网站采取了一些反爬虫措施,比如,服务器会检测某个 IP 在单位时间内的请求次数,如果超过了这个阈值,就会直接拒绝服务,返回一些错误信息,这种情况可以称为封 IP。

Python爬虫设置代理IP(图文)

爬虫代理获取

获取IP池其实要找信的过的爬虫代理,我用的就是飞猪爬虫代理  ,优点自然就是使用率高于99%,缺点是没有免费的,0.03元一个IP,一天可以用1000个,一次可以API提取200个 。当然如果你们的用量还不满足可以加! 

Python爬虫设置代理IP(图文)

Python爬虫设置代理IP(图文)

爬虫代理IP的使用

运行上面的代码会得到一个随机的proxies,把它直接传入requests的get方法中即可。

Python爬虫设置代理IP(图文)

Python爬虫设置代理IP(图文)

1、测试效果

本次测试得出的结论:飞猪IP爬虫代理,可用率、响应速度、稳定性、价格、安全性、使用频率,还是不错的,值得推荐

Python爬虫设置代理IP(图文)

总结:以上就是关于python爬虫设置代理IP的步骤内容,感谢大家的阅读和对三水点靠木的支持。

Python 相关文章推荐
在Python中处理日期和时间的基本知识点整理汇总
May 22 Python
Python3 适合初学者学习的银行账户登录系统实例
Aug 08 Python
python虚拟环境的安装配置图文教程
Oct 20 Python
Python中修改字符串的四种方法
Nov 02 Python
python实现微信机器人: 登录微信、消息接收、自动回复功能
Apr 29 Python
在Qt5和PyQt5中设置支持高分辨率屏幕自适应的方法
Jun 18 Python
Python pip替换为阿里源的方法步骤
Jul 02 Python
python读取tif图片时保留其16bit的编码格式实例
Jan 13 Python
Python Numpy库常见用法入门教程
Jan 16 Python
Python  word实现读取及导出代码解析
Jul 09 Python
用Python实现童年贪吃蛇小游戏功能的实例代码
Dec 07 Python
opencv用VS2013调试时用Image Watch插件查看图片
Jul 26 Python
celery4+django2定时任务的实现代码
Dec 23 #Python
python3使用pandas获取股票数据的方法
Dec 22 #Python
Python实现将通信达.day文件读取为DataFrame
Dec 22 #Python
python3 cvs将数据读取为字典的方法
Dec 22 #Python
python将txt等文件中的数据读为numpy数组的方法
Dec 22 #Python
python将txt文件读取为字典的示例
Dec 22 #Python
Python3实现对列表按元组指定列进行排序的方法分析
Dec 22 #Python
You might like
PHP4.04简明安装
2006/10/09 PHP
PHP的foreach中使用引用时需要注意的一个问题和解决方法
2014/05/29 PHP
PHP.ini安全配置检测工具pcc简单介绍
2015/07/02 PHP
YII Framework框架教程之使用YIIC快速创建YII应用详解
2016/03/15 PHP
PHP实现数组向任意位置插入,删除,替换数据操作示例
2019/04/05 PHP
jQuery中需要注意的细节问题小结
2011/12/06 Javascript
JavaScript 用cloneNode方法克隆节点的代码
2012/10/15 Javascript
网页中表单按回车就自动提交的问题的解决方案
2014/11/03 Javascript
jQuery实现Email邮箱地址自动补全功能代码
2015/11/03 Javascript
谈谈我对JavaScript DOM事件的理解
2015/12/18 Javascript
jQuery与JavaScript节点创建方法的对比
2016/11/18 Javascript
JS中使用 after 伪类清除浮动实例
2017/03/01 Javascript
JavaScript仿微信打飞机游戏
2020/07/05 Javascript
JavaScript之浏览器对象_动力节点Java学院整理
2017/07/03 Javascript
webpack打包js文件及部署的实现方法
2017/12/18 Javascript
webpack写jquery插件的环境配置
2017/12/21 jQuery
vue实现未登录跳转到登录页面的方法
2018/07/17 Javascript
深入理解Vue 的钩子函数
2018/09/05 Javascript
vue-router实现嵌套路由的讲解
2019/01/19 Javascript
JavaScript实现图片上传并预览并提交ajax
2019/09/30 Javascript
PHP 502bad gateway原因及解决方案
2020/11/13 Javascript
Node快速切换版本、版本回退(降级)、版本更新(升级)
2021/01/07 Javascript
python使用cStringIO实现临时内存文件访问的方法
2015/03/26 Python
Python实现的摇骰子猜大小功能小游戏示例
2017/12/18 Python
python实现朴素贝叶斯算法
2018/11/19 Python
Python+threading模块对单个接口进行并发测试
2019/06/25 Python
Python函数的返回值、匿名函数lambda、filter函数、map函数、reduce函数用法实例分析
2019/12/26 Python
Python语法垃圾回收机制原理解析
2020/03/25 Python
西班牙伏林航空公司:Vueling
2016/08/05 全球购物
ALDO美国官网:加拿大女鞋品牌
2018/12/28 全球购物
财会专业大学生求职信
2014/09/26 职场文书
担保书范文
2015/01/20 职场文书
给客户的感谢信
2015/01/21 职场文书
趣味运动会赞词
2015/07/22 职场文书
python urllib库的使用详解
2021/04/13 Python
MySQL 8.0 Online DDL快速加列的相关总结
2021/06/02 MySQL