Python爬虫设置代理IP(图文)


Posted in Python onDecember 23, 2018

在爬虫的过程中,我们经常会遇见很多网站采取了防爬取技术,或者说因为自己采集网站信息的强度和采集速度太大,给对方服务器带去了太多的压力。

如果你一直用同一个代理ip爬取这个网页,很有可能ip会被禁止访问网页,所以基本上做爬虫的都躲不过去ip的问题。

Python爬虫设置代理IP(图文)

1、我们在做爬虫的过程中经常会遇到这样的情况,最初爬虫正常运行,正常爬取数据,一切看起来都是那么美好,然而不久之后可能会出现错误,比如 403 Forbidden,这时候你打开网页一看,可能会看到“您的 IP 访问频率太高”这样的提示。出现这种情况的原因是网站采取了一些反爬虫措施,比如,服务器会检测某个 IP 在单位时间内的请求次数,如果超过了这个阈值,就会直接拒绝服务,返回一些错误信息,这种情况可以称为封 IP。

Python爬虫设置代理IP(图文)

爬虫代理获取

获取IP池其实要找信的过的爬虫代理,我用的就是飞猪爬虫代理  ,优点自然就是使用率高于99%,缺点是没有免费的,0.03元一个IP,一天可以用1000个,一次可以API提取200个 。当然如果你们的用量还不满足可以加! 

Python爬虫设置代理IP(图文)

Python爬虫设置代理IP(图文)

爬虫代理IP的使用

运行上面的代码会得到一个随机的proxies,把它直接传入requests的get方法中即可。

Python爬虫设置代理IP(图文)

Python爬虫设置代理IP(图文)

1、测试效果

本次测试得出的结论:飞猪IP爬虫代理,可用率、响应速度、稳定性、价格、安全性、使用频率,还是不错的,值得推荐

Python爬虫设置代理IP(图文)

总结:以上就是关于python爬虫设置代理IP的步骤内容,感谢大家的阅读和对三水点靠木的支持。

Python 相关文章推荐
python统计cpu利用率的方法
Jun 02 Python
python的else子句使用指南
Feb 27 Python
Python三级目录展示的实现方法
Sep 28 Python
tensorflow实现KNN识别MNIST
Mar 12 Python
基于python3实现socket文件传输和校验
Jul 28 Python
Python3按一定数据位数格式处理bin文件的方法
Jan 24 Python
利用python Selenium实现自动登陆京东签到领金币功能
Oct 31 Python
flask 使用 flask_apscheduler 做定时循环任务的实现
Dec 10 Python
python保留格式汇总各部门excel内容的实现思路
Jun 01 Python
scrapy-redis分布式爬虫的搭建过程(理论篇)
Sep 29 Python
windows下python 3.9 Numpy scipy和matlabplot的安装教程详解
Nov 28 Python
解决Django transaction进行事务管理踩过的坑
Apr 24 Python
celery4+django2定时任务的实现代码
Dec 23 #Python
python3使用pandas获取股票数据的方法
Dec 22 #Python
Python实现将通信达.day文件读取为DataFrame
Dec 22 #Python
python3 cvs将数据读取为字典的方法
Dec 22 #Python
python将txt等文件中的数据读为numpy数组的方法
Dec 22 #Python
python将txt文件读取为字典的示例
Dec 22 #Python
Python3实现对列表按元组指定列进行排序的方法分析
Dec 22 #Python
You might like
PHP版自动生成文章摘要
2008/07/23 PHP
PHP技术开发技巧分享
2010/03/23 PHP
如何在Ubuntu下启动Apache的Rewrite功能
2013/07/05 PHP
php统计数组元素个数的方法
2015/07/02 PHP
ThinkPHP5.1框架页面跳转及修改跳转页面模版示例
2019/05/06 PHP
jquery里的正则表达式说明
2011/08/03 Javascript
2012年开发人员的16款新鲜的jquery插件体验分享
2012/12/28 Javascript
js绑定事件this指向发生改变的问题解决方法
2013/04/23 Javascript
简介AngularJS中使用factory和service的方法
2015/06/17 Javascript
使用JavaScript制作一个简单的计数器的方法
2015/07/07 Javascript
jQuery实现带滑动条的菜单效果代码
2015/08/26 Javascript
jQuery实用技巧必备(上)
2015/11/02 Javascript
利用Jasmine对Angular进行单元测试的方法详解
2017/06/12 Javascript
利用JQUERY实现多个AJAX请求等待的实例
2017/12/14 jQuery
nuxt.js中间件实现拦截权限判断的方法
2018/11/21 Javascript
小程序指纹验证的实现代码
2018/12/04 Javascript
vue组件实现移动端九宫格转盘抽奖
2020/10/16 Javascript
[04:03]2014DOTA2西雅图国际邀请赛 LGD战队巡礼
2014/07/07 DOTA
python条件和循环的使用方法
2013/11/01 Python
win10环境下python3.5安装步骤图文教程
2017/02/03 Python
Python基于回溯法子集树模板实现图的遍历功能示例
2017/09/05 Python
使用Python通过win32 COM打开Excel并添加Sheet的方法
2018/05/02 Python
解决pandas无法在pycharm中使用plot()方法显示图像的问题
2018/05/24 Python
python 保存float类型的小数的位数方法
2018/10/17 Python
Python使用pyserial进行串口通信的实例
2019/07/02 Python
html5指南-3.如何实现html元素拖拽功能
2013/01/07 HTML / CSS
日本无添加化妆品:HABA
2016/08/18 全球购物
英国最大的宝石首饰超市:QP Jewellers
2018/09/23 全球购物
北京华建集团SQL面试题
2014/06/03 面试题
学生励志演讲稿
2014/01/06 职场文书
学习雷锋演讲稿
2014/05/10 职场文书
党员志愿者活动总结
2014/06/26 职场文书
2014年护士长工作总结
2014/11/11 职场文书
八月一日观后感
2015/06/10 职场文书
新学期主题班会
2015/08/17 职场文书
Nginx实现负载均衡的项目实践
2022/03/18 Servers