Python爬虫设置代理IP(图文)


Posted in Python onDecember 23, 2018

在爬虫的过程中,我们经常会遇见很多网站采取了防爬取技术,或者说因为自己采集网站信息的强度和采集速度太大,给对方服务器带去了太多的压力。

如果你一直用同一个代理ip爬取这个网页,很有可能ip会被禁止访问网页,所以基本上做爬虫的都躲不过去ip的问题。

Python爬虫设置代理IP(图文)

1、我们在做爬虫的过程中经常会遇到这样的情况,最初爬虫正常运行,正常爬取数据,一切看起来都是那么美好,然而不久之后可能会出现错误,比如 403 Forbidden,这时候你打开网页一看,可能会看到“您的 IP 访问频率太高”这样的提示。出现这种情况的原因是网站采取了一些反爬虫措施,比如,服务器会检测某个 IP 在单位时间内的请求次数,如果超过了这个阈值,就会直接拒绝服务,返回一些错误信息,这种情况可以称为封 IP。

Python爬虫设置代理IP(图文)

爬虫代理获取

获取IP池其实要找信的过的爬虫代理,我用的就是飞猪爬虫代理  ,优点自然就是使用率高于99%,缺点是没有免费的,0.03元一个IP,一天可以用1000个,一次可以API提取200个 。当然如果你们的用量还不满足可以加! 

Python爬虫设置代理IP(图文)

Python爬虫设置代理IP(图文)

爬虫代理IP的使用

运行上面的代码会得到一个随机的proxies,把它直接传入requests的get方法中即可。

Python爬虫设置代理IP(图文)

Python爬虫设置代理IP(图文)

1、测试效果

本次测试得出的结论:飞猪IP爬虫代理,可用率、响应速度、稳定性、价格、安全性、使用频率,还是不错的,值得推荐

Python爬虫设置代理IP(图文)

总结:以上就是关于python爬虫设置代理IP的步骤内容,感谢大家的阅读和对三水点靠木的支持。

Python 相关文章推荐
Python获取邮件地址的方法
Jul 10 Python
Python实现简单登录验证
Apr 13 Python
Python实现Linux的find命令实例分享
Jun 04 Python
浅谈pandas中shift和diff函数关系
Apr 08 Python
实例讲解python中的协程
Oct 08 Python
Python类的继承用法示例
Jan 31 Python
python模块之subprocess模块级方法的使用
Mar 26 Python
解决python运行启动报错问题
Jun 01 Python
深入了解Python 方法之类方法 & 静态方法
Aug 17 Python
Python自动化测试中yaml文件读取操作
Aug 20 Python
Python中random模块常用方法的使用教程
Oct 04 Python
用Python提取PDF表格的方法
Apr 11 Python
celery4+django2定时任务的实现代码
Dec 23 #Python
python3使用pandas获取股票数据的方法
Dec 22 #Python
Python实现将通信达.day文件读取为DataFrame
Dec 22 #Python
python3 cvs将数据读取为字典的方法
Dec 22 #Python
python将txt等文件中的数据读为numpy数组的方法
Dec 22 #Python
python将txt文件读取为字典的示例
Dec 22 #Python
Python3实现对列表按元组指定列进行排序的方法分析
Dec 22 #Python
You might like
php之Memcache学习笔记
2013/06/17 PHP
PHP 输出URL的快捷方式示例代码
2013/09/22 PHP
ThinkPHP CURD方法之data方法详解
2014/06/18 PHP
PHP读取汉字的点阵数据
2015/06/22 PHP
PHP里的单例类写法实例
2015/06/25 PHP
PHP根据key删除数组中指定的元素
2019/02/28 PHP
使用jQuery向asp.net Mvc传递复杂json数据-ModelBinder篇
2010/05/07 Javascript
用apply让javascript函数仅执行一次的代码
2010/06/27 Javascript
js 如何实现对数据库的增删改查
2012/11/23 Javascript
Ext GridPanel加载完数据后进行操作示例代码
2014/06/17 Javascript
node.js中的console.timeEnd方法使用说明
2014/12/09 Javascript
html的DOM中document对象anchors集合用法实例
2015/01/21 Javascript
js跨浏览器的事件侦听器和事件对象的使用方法
2015/12/17 Javascript
JS图片定时翻滚效果实现方法
2016/06/21 Javascript
JS获取浮动(float)元素的style.left值为空的快速解决办法
2017/02/19 Javascript
javascript与PHP动态往类中添加方法对比
2018/03/21 Javascript
Vue-cli@3.0 插件系统简析
2018/09/05 Javascript
了解javascript中的Dom操作
2019/05/27 Javascript
node.js获取参数的常用方法(总结)
2017/05/29 Python
浅谈Django自定义模板标签template_tags的用处
2017/12/20 Python
python3操作微信itchat实现发送图片
2018/02/24 Python
python pandas库的安装和创建
2019/01/10 Python
python3实现弹弹球小游戏
2019/11/25 Python
python 将dicom图片转换成jpg图片的实例
2020/01/13 Python
Python操作Jira库常用方法解析
2020/04/10 Python
怎样有效的进行自我评价
2013/10/06 职场文书
英语道歉信范文
2014/01/09 职场文书
大学生蛋糕店创业计划书
2014/01/13 职场文书
关于护士节的演讲稿
2014/05/26 职场文书
意向书范本
2014/07/29 职场文书
2014县委书记党的群众路线教育实践活动对照检查材料思想汇报
2014/09/22 职场文书
有限责任公司股东合作协议书范本
2014/10/30 职场文书
见习报告的格式
2014/10/31 职场文书
接待员岗位职责
2015/02/13 职场文书
2015年创先争优工作总结
2015/05/23 职场文书
无婚姻登记记录证明
2015/06/18 职场文书