Python爬虫设置代理IP(图文)


Posted in Python onDecember 23, 2018

在爬虫的过程中,我们经常会遇见很多网站采取了防爬取技术,或者说因为自己采集网站信息的强度和采集速度太大,给对方服务器带去了太多的压力。

如果你一直用同一个代理ip爬取这个网页,很有可能ip会被禁止访问网页,所以基本上做爬虫的都躲不过去ip的问题。

Python爬虫设置代理IP(图文)

1、我们在做爬虫的过程中经常会遇到这样的情况,最初爬虫正常运行,正常爬取数据,一切看起来都是那么美好,然而不久之后可能会出现错误,比如 403 Forbidden,这时候你打开网页一看,可能会看到“您的 IP 访问频率太高”这样的提示。出现这种情况的原因是网站采取了一些反爬虫措施,比如,服务器会检测某个 IP 在单位时间内的请求次数,如果超过了这个阈值,就会直接拒绝服务,返回一些错误信息,这种情况可以称为封 IP。

Python爬虫设置代理IP(图文)

爬虫代理获取

获取IP池其实要找信的过的爬虫代理,我用的就是飞猪爬虫代理  ,优点自然就是使用率高于99%,缺点是没有免费的,0.03元一个IP,一天可以用1000个,一次可以API提取200个 。当然如果你们的用量还不满足可以加! 

Python爬虫设置代理IP(图文)

Python爬虫设置代理IP(图文)

爬虫代理IP的使用

运行上面的代码会得到一个随机的proxies,把它直接传入requests的get方法中即可。

Python爬虫设置代理IP(图文)

Python爬虫设置代理IP(图文)

1、测试效果

本次测试得出的结论:飞猪IP爬虫代理,可用率、响应速度、稳定性、价格、安全性、使用频率,还是不错的,值得推荐

Python爬虫设置代理IP(图文)

总结:以上就是关于python爬虫设置代理IP的步骤内容,感谢大家的阅读和对三水点靠木的支持。

Python 相关文章推荐
使用Python读写文本文件及编写简单的文本编辑器
Mar 11 Python
使用Python的Django框架结合jQuery实现AJAX购物车页面
Apr 11 Python
简单谈谈Python中的反转字符串问题
Oct 24 Python
老生常谈Python序列化和反序列化
Jun 28 Python
Python中if elif else及缩进的使用简述
May 31 Python
Python实现获取系统临时目录及临时文件的方法示例
Jun 26 Python
Python中pymysql 模块的使用详解
Aug 12 Python
python多环境切换及pyenv使用过程详解
Sep 27 Python
Python实现图像的垂直投影示例
Jan 17 Python
Pycharm激活码激活两种快速方式(附最新激活码和插件)
Mar 12 Python
Python字符串查找基本操作代码案例
Oct 27 Python
Python 处理表格进行成绩排序的操作代码
Jul 26 Python
celery4+django2定时任务的实现代码
Dec 23 #Python
python3使用pandas获取股票数据的方法
Dec 22 #Python
Python实现将通信达.day文件读取为DataFrame
Dec 22 #Python
python3 cvs将数据读取为字典的方法
Dec 22 #Python
python将txt等文件中的数据读为numpy数组的方法
Dec 22 #Python
python将txt文件读取为字典的示例
Dec 22 #Python
Python3实现对列表按元组指定列进行排序的方法分析
Dec 22 #Python
You might like
在Linux系统的服务器上隐藏PHP版本号的方法
2015/06/06 PHP
认识延迟时间为0的setTimeout
2008/05/16 Javascript
javascript  Error 对象 错误处理
2008/05/18 Javascript
JQuery,Extjs,YUI,Prototype,Dojo 等JS框架的区别和应用场景简述
2010/04/15 Javascript
动态创建script在IE中缓存js文件时导致编码的解决方法
2014/05/04 Javascript
js简单的弹出框有关闭按钮
2014/05/05 Javascript
javascript 构造函数方式定义对象
2015/01/02 Javascript
js的window.showModalDialog及window.open用法实例分析
2015/01/29 Javascript
jQuery on()方法使用技巧详解
2015/04/16 Javascript
浅谈javascript事件取消和阻止冒泡
2015/05/26 Javascript
js如何实现点击标签文字,文字在文本框出现
2015/08/05 Javascript
ionic js 模型 $ionicModal 可以遮住用户主界面的内容框
2016/06/06 Javascript
jQuery EasyUI学习教程之datagrid点击列表头排序
2016/07/09 Javascript
jQuery实现底部浮动窗口效果
2016/09/07 Javascript
jQuery实现两个select控件的互移操作
2016/12/22 Javascript
利用Jquery实现几款漂亮实用的时间轴(附示例代码)
2017/02/15 Javascript
xmlplus组件设计系列之列表(4)
2017/04/26 Javascript
JS实现的简单四则运算计算器功能示例
2017/09/27 Javascript
浅谈vue父子组件怎么传值
2018/07/21 Javascript
对angularJs中ng-style动态改变样式的实例讲解
2018/09/30 Javascript
JavaScript使用localStorage存储数据
2019/09/25 Javascript
numpy中实现ndarray数组返回符合特定条件的索引方法
2018/04/17 Python
python实现排序算法解析
2018/09/08 Python
python笔记_将循环内容在一行输出的方法
2019/08/08 Python
Python class的继承方法代码实例
2020/02/14 Python
Selenium+BeautifulSoup+json获取Script标签内的json数据
2020/12/07 Python
CSS3动画之利用requestAnimationFrame触发重新播放功能
2019/09/11 HTML / CSS
Stio官网:男女、儿童户外服装
2019/12/13 全球购物
财务会计应届生求职信
2013/11/24 职场文书
化工实习心得体会
2014/09/09 职场文书
幼儿教师远程研修感悟
2015/11/18 职场文书
python实现批量移动文件
2021/04/05 Python
给numpy.array增加维度的超简单方法
2021/06/02 Python
Python移位密码、仿射变换解密实例代码
2021/06/27 Python
解决spring.thymeleaf.cache=false不起作用的问题
2022/06/10 Java/Android