Python爬虫设置代理IP(图文)


Posted in Python onDecember 23, 2018

在爬虫的过程中,我们经常会遇见很多网站采取了防爬取技术,或者说因为自己采集网站信息的强度和采集速度太大,给对方服务器带去了太多的压力。

如果你一直用同一个代理ip爬取这个网页,很有可能ip会被禁止访问网页,所以基本上做爬虫的都躲不过去ip的问题。

Python爬虫设置代理IP(图文)

1、我们在做爬虫的过程中经常会遇到这样的情况,最初爬虫正常运行,正常爬取数据,一切看起来都是那么美好,然而不久之后可能会出现错误,比如 403 Forbidden,这时候你打开网页一看,可能会看到“您的 IP 访问频率太高”这样的提示。出现这种情况的原因是网站采取了一些反爬虫措施,比如,服务器会检测某个 IP 在单位时间内的请求次数,如果超过了这个阈值,就会直接拒绝服务,返回一些错误信息,这种情况可以称为封 IP。

Python爬虫设置代理IP(图文)

爬虫代理获取

获取IP池其实要找信的过的爬虫代理,我用的就是飞猪爬虫代理  ,优点自然就是使用率高于99%,缺点是没有免费的,0.03元一个IP,一天可以用1000个,一次可以API提取200个 。当然如果你们的用量还不满足可以加! 

Python爬虫设置代理IP(图文)

Python爬虫设置代理IP(图文)

爬虫代理IP的使用

运行上面的代码会得到一个随机的proxies,把它直接传入requests的get方法中即可。

Python爬虫设置代理IP(图文)

Python爬虫设置代理IP(图文)

1、测试效果

本次测试得出的结论:飞猪IP爬虫代理,可用率、响应速度、稳定性、价格、安全性、使用频率,还是不错的,值得推荐

Python爬虫设置代理IP(图文)

总结:以上就是关于python爬虫设置代理IP的步骤内容,感谢大家的阅读和对三水点靠木的支持。

Python 相关文章推荐
python之wxPython菜单使用详解
Sep 28 Python
解析Python中的生成器及其与迭代器的差异
Jun 20 Python
轻松理解Python 中的 descriptor
Sep 15 Python
Python内置函数—vars的具体使用方法
Dec 04 Python
使用C++扩展Python的功能详解
Jan 12 Python
python中csv文件的若干读写方法小结
Jul 04 Python
使用python采集脚本之家电子书资源并自动下载到本地的实例脚本
Oct 23 Python
python 返回列表中某个值的索引方法
Nov 07 Python
python爬虫之爬取百度音乐的实现方法
Aug 24 Python
python 普通克里金(Kriging)法的实现
Dec 19 Python
Django查询优化及ajax编码格式原理解析
Mar 25 Python
PyQt5实现登录页面
May 30 Python
celery4+django2定时任务的实现代码
Dec 23 #Python
python3使用pandas获取股票数据的方法
Dec 22 #Python
Python实现将通信达.day文件读取为DataFrame
Dec 22 #Python
python3 cvs将数据读取为字典的方法
Dec 22 #Python
python将txt等文件中的数据读为numpy数组的方法
Dec 22 #Python
python将txt文件读取为字典的示例
Dec 22 #Python
Python3实现对列表按元组指定列进行排序的方法分析
Dec 22 #Python
You might like
图书管理程序(二)
2006/10/09 PHP
UTF8编码内的繁简转换的PHP类
2009/07/09 PHP
PHP和Mysqlweb应用开发核心技术 第1部分 Php基础-3 代码组织和重用2
2011/07/03 PHP
数组与类使用PHP的可变变量名需要的注意的问题
2013/06/20 PHP
php实现将HTML页面转换成word并且保存的方法
2016/10/14 PHP
详谈 Jquery Ajax异步处理Json数据.
2011/09/09 Javascript
Javascript根据指定下标或对象删除数组元素
2012/12/21 Javascript
通过JavaScript使Div居中并随网页大小改变而改变
2013/06/24 Javascript
javascript抖动元素的小例子
2013/10/28 Javascript
原生javascript实现简单的datagrid数据表格
2015/01/02 Javascript
Javascript缓存API
2016/06/14 Javascript
微信小程序 wx.request(OBJECT)发起请求详解
2016/10/13 Javascript
原生JS轮播图插件
2017/02/09 Javascript
vue 2.0组件与v-model详解
2017/03/27 Javascript
Vue自定义图片懒加载指令v-lazyload详解
2020/12/31 Javascript
p5.js入门教程之键盘交互
2018/03/19 Javascript
Vue render函数实战之实现tabs选项卡组件
2019/04/22 Javascript
Vuex 模块化使用详解
2019/07/31 Javascript
Vue+webpack实现懒加载过程解析
2020/02/17 Javascript
微信小程序连续签到7天积分获得功能的示例代码
2020/08/20 Javascript
python文件操作相关知识点总结整理
2016/02/22 Python
如何利用python制作时间戳转换工具详解
2018/09/12 Python
解决PyCharm不运行脚本,而是运行单元测试的问题
2019/01/17 Python
浅谈Python_Openpyxl使用(最全总结)
2019/09/05 Python
wxPython实现整点报时
2019/11/18 Python
python脚本监控logstash进程并邮件告警实例
2020/04/28 Python
Python之变量类型和if判断方式
2020/05/05 Python
Python selenium环境搭建实现过程解析
2020/09/08 Python
缓刑人员的思想汇报
2014/01/11 职场文书
服装行业创业计划书范文
2014/02/05 职场文书
群众路线剖析材料范文
2014/10/09 职场文书
2014年计生工作总结
2014/11/21 职场文书
2015年反洗钱工作总结
2015/04/25 职场文书
青年志愿者服务活动总结
2015/05/06 职场文书
选对餐饮营销策略,营业额才会上涨
2019/08/27 职场文书
JavaScript 反射学习技巧
2021/10/16 Javascript