Python爬虫设置代理IP(图文)


Posted in Python onDecember 23, 2018

在爬虫的过程中,我们经常会遇见很多网站采取了防爬取技术,或者说因为自己采集网站信息的强度和采集速度太大,给对方服务器带去了太多的压力。

如果你一直用同一个代理ip爬取这个网页,很有可能ip会被禁止访问网页,所以基本上做爬虫的都躲不过去ip的问题。

Python爬虫设置代理IP(图文)

1、我们在做爬虫的过程中经常会遇到这样的情况,最初爬虫正常运行,正常爬取数据,一切看起来都是那么美好,然而不久之后可能会出现错误,比如 403 Forbidden,这时候你打开网页一看,可能会看到“您的 IP 访问频率太高”这样的提示。出现这种情况的原因是网站采取了一些反爬虫措施,比如,服务器会检测某个 IP 在单位时间内的请求次数,如果超过了这个阈值,就会直接拒绝服务,返回一些错误信息,这种情况可以称为封 IP。

Python爬虫设置代理IP(图文)

爬虫代理获取

获取IP池其实要找信的过的爬虫代理,我用的就是飞猪爬虫代理  ,优点自然就是使用率高于99%,缺点是没有免费的,0.03元一个IP,一天可以用1000个,一次可以API提取200个 。当然如果你们的用量还不满足可以加! 

Python爬虫设置代理IP(图文)

Python爬虫设置代理IP(图文)

爬虫代理IP的使用

运行上面的代码会得到一个随机的proxies,把它直接传入requests的get方法中即可。

Python爬虫设置代理IP(图文)

Python爬虫设置代理IP(图文)

1、测试效果

本次测试得出的结论:飞猪IP爬虫代理,可用率、响应速度、稳定性、价格、安全性、使用频率,还是不错的,值得推荐

Python爬虫设置代理IP(图文)

总结:以上就是关于python爬虫设置代理IP的步骤内容,感谢大家的阅读和对三水点靠木的支持。

Python 相关文章推荐
简单文件操作python 修改文件指定行的方法
May 15 Python
Python列表生成器的循环技巧分享
Mar 06 Python
Python实现在tkinter中使用matplotlib绘制图形的方法示例
Jan 18 Python
django 发送手机验证码的示例代码
Apr 25 Python
浅谈Pandas 排序之后索引的问题
Jun 07 Python
python二维列表一维列表的互相转换实例
Jul 02 Python
详解基于python的多张不同宽高图片拼接成大图
Sep 26 Python
python中@property和property函数常见使用方法示例
Oct 21 Python
解决python中显示图片的plt.imshow plt.show()内存泄漏问题
Apr 24 Python
解决Python发送Http请求时,中文乱码的问题
Apr 30 Python
python中os包的用法
Jun 01 Python
Pycharm github配置实现过程图解
Oct 13 Python
celery4+django2定时任务的实现代码
Dec 23 #Python
python3使用pandas获取股票数据的方法
Dec 22 #Python
Python实现将通信达.day文件读取为DataFrame
Dec 22 #Python
python3 cvs将数据读取为字典的方法
Dec 22 #Python
python将txt等文件中的数据读为numpy数组的方法
Dec 22 #Python
python将txt文件读取为字典的示例
Dec 22 #Python
Python3实现对列表按元组指定列进行排序的方法分析
Dec 22 #Python
You might like
MySQL修改密码方法总结
2008/03/25 PHP
PHP文件锁定写入实例解析
2014/07/14 PHP
PHP中常用的魔术方法
2017/04/28 PHP
JS 实现完美include载入实现代码
2010/08/05 Javascript
functional继承模式 摘自javascript:the good parts
2011/06/20 Javascript
JavaScript原型继承之基础机制分析
2011/08/26 Javascript
Javascript获取表单名称(name)的方法
2015/04/02 Javascript
Javascript aop(面向切面编程)之around(环绕)分析
2015/05/01 Javascript
JavaScript多线程详解
2015/08/12 Javascript
javascript防篡改对象实例详解
2017/04/10 Javascript
js+html制作简单日历的方法
2017/06/27 Javascript
javaScript动态添加Li元素的实例
2018/02/24 Javascript
js闭包学习心得总结
2018/04/17 Javascript
jQuery插件jsonview展示json数据
2018/05/26 jQuery
详解ECMAScript typeof用法
2018/07/25 Javascript
nuxt.js中间件实现拦截权限判断的方法
2018/11/21 Javascript
layui table 获取分页 limit的方法
2019/09/20 Javascript
vue中实现拖动调整左右两侧div的宽度的示例代码
2020/07/22 Javascript
原生js实现放大镜组件
2021/01/22 Javascript
Python中使用PDB库调试程序
2015/04/05 Python
pandas DataFrame实现几列数据合并成为新的一列方法
2018/06/08 Python
django从请求到响应的过程深入讲解
2018/08/01 Python
Python实现注册、登录小程序功能
2018/09/21 Python
宝塔面板成功部署Django项目流程(图文)
2020/06/22 Python
python中的测试框架
2020/11/13 Python
Elizabeth Gage官网:英国最好的珠宝设计之一
2020/09/26 全球购物
上课迟到检讨书100字
2014/01/11 职场文书
学校后勤岗位职责
2014/02/19 职场文书
中国文明网向国旗敬礼寄语大全
2014/09/27 职场文书
怀孕辞职信怎么写
2015/02/28 职场文书
赞助商致辞
2015/07/30 职场文书
2019年怎样才能撰写出优秀的自荐信
2019/03/25 职场文书
oracle连接ODBC sqlserver数据源的详细步骤
2021/07/25 Oracle
python游戏开发之pygame实现接球小游戏
2022/04/22 Python
Python通用验证码识别OCR库ddddocr的安装使用教程
2022/07/07 Python
Win11 vmware不兼容怎么办?Win11与VMware虚拟机不兼容的解决方法
2023/01/09 数码科技