Python爬虫设置代理IP(图文)


Posted in Python onDecember 23, 2018

在爬虫的过程中,我们经常会遇见很多网站采取了防爬取技术,或者说因为自己采集网站信息的强度和采集速度太大,给对方服务器带去了太多的压力。

如果你一直用同一个代理ip爬取这个网页,很有可能ip会被禁止访问网页,所以基本上做爬虫的都躲不过去ip的问题。

Python爬虫设置代理IP(图文)

1、我们在做爬虫的过程中经常会遇到这样的情况,最初爬虫正常运行,正常爬取数据,一切看起来都是那么美好,然而不久之后可能会出现错误,比如 403 Forbidden,这时候你打开网页一看,可能会看到“您的 IP 访问频率太高”这样的提示。出现这种情况的原因是网站采取了一些反爬虫措施,比如,服务器会检测某个 IP 在单位时间内的请求次数,如果超过了这个阈值,就会直接拒绝服务,返回一些错误信息,这种情况可以称为封 IP。

Python爬虫设置代理IP(图文)

爬虫代理获取

获取IP池其实要找信的过的爬虫代理,我用的就是飞猪爬虫代理  ,优点自然就是使用率高于99%,缺点是没有免费的,0.03元一个IP,一天可以用1000个,一次可以API提取200个 。当然如果你们的用量还不满足可以加! 

Python爬虫设置代理IP(图文)

Python爬虫设置代理IP(图文)

爬虫代理IP的使用

运行上面的代码会得到一个随机的proxies,把它直接传入requests的get方法中即可。

Python爬虫设置代理IP(图文)

Python爬虫设置代理IP(图文)

1、测试效果

本次测试得出的结论:飞猪IP爬虫代理,可用率、响应速度、稳定性、价格、安全性、使用频率,还是不错的,值得推荐

Python爬虫设置代理IP(图文)

总结:以上就是关于python爬虫设置代理IP的步骤内容,感谢大家的阅读和对三水点靠木的支持。

Python 相关文章推荐
Python文件右键找不到IDLE打开项解决办法
Jun 08 Python
浅谈Python的异常处理
Jun 19 Python
深入解析Python编程中super关键字的用法
Jun 24 Python
python 根据正则表达式提取指定的内容实例详解
Dec 04 Python
Python字符串处理实例详解
May 18 Python
python 实现在Excel末尾增加新行
May 02 Python
Python使用sort和class实现的多级排序功能示例
Aug 15 Python
Python编程实现tail-n查看日志文件的方法
Jul 08 Python
django ManyToManyField多对多关系的实例详解
Aug 09 Python
numpy.ndarray 实现对特定行或列取值
Dec 05 Python
在PyTorch中使用标签平滑正则化的问题
Apr 03 Python
Python如何把不同类型数据的json序列化
Apr 30 Python
celery4+django2定时任务的实现代码
Dec 23 #Python
python3使用pandas获取股票数据的方法
Dec 22 #Python
Python实现将通信达.day文件读取为DataFrame
Dec 22 #Python
python3 cvs将数据读取为字典的方法
Dec 22 #Python
python将txt等文件中的数据读为numpy数组的方法
Dec 22 #Python
python将txt文件读取为字典的示例
Dec 22 #Python
Python3实现对列表按元组指定列进行排序的方法分析
Dec 22 #Python
You might like
《斗罗大陆》六翼天使武魂最强,为什么老千家不是上三宗?
2020/03/02 国漫
PHP调用三种数据库的方法(3)
2006/10/09 PHP
php高级编程-函数-郑阿奇
2011/07/04 PHP
php根据年月获取季度的方法
2014/03/31 PHP
JavaScript中几种常见排序算法小结
2011/02/22 Javascript
Nodejs中读取中文文件编码问题、发送邮件和定时任务实例
2015/01/01 NodeJs
javascript的tab切换原理与效果实现方法
2015/01/10 Javascript
window.location.reload 刷新使用分析(去对话框)
2015/11/11 Javascript
js实现搜索框关键字智能匹配代码
2020/03/26 Javascript
jQuery移动端日期(datedropper)和时间(timedropper)选择器附源码下载
2016/04/19 Javascript
JavaScript仿淘宝页面图片滚动加载及刷新回顶部的方法解析
2016/05/24 Javascript
快速掌握jquery分页插件jqPaginator的使用方法
2017/08/09 jQuery
Angular4学习笔记之根模块与Ng模块
2017/09/09 Javascript
改变vue请求过来的数据中的某一项值的方法(详解)
2018/03/08 Javascript
浅谈angular4.0中路由传递参数、获取参数最nice的写法
2018/03/12 Javascript
vue实现导航菜单和编辑文本的示例代码
2020/07/04 Javascript
JS如何生成动态列表
2020/09/22 Javascript
[02:52]2014DOTA2西雅图国际邀请赛 CIS战队巡礼
2014/07/07 DOTA
[01:04:32]DOTA2-DPC中国联赛 正赛 Aster vs LBZS BO3 第二场 2月23日
2021/03/11 DOTA
python将html转成PDF的实现代码(包含中文)
2013/03/04 Python
Python实现遍历数据库并获取key的值
2015/05/17 Python
浅析使用Python操作文件
2017/07/31 Python
基于DataFrame筛选数据与loc的用法详解
2018/05/18 Python
pycharm在调试python时执行其他语句的方法
2018/11/29 Python
Python中查看变量的类型内存地址所占字节的大小
2019/06/26 Python
简单了解python高阶函数map/reduce
2019/06/28 Python
python剪切视频与合并视频的实现
2020/03/03 Python
python 爬虫基本使用——统计杭电oj题目正确率并排序
2020/10/26 Python
Mio Skincare英国官网:身体紧致及孕期身体护理
2018/08/19 全球购物
英国电视和家用电器购物网站:rlrdistribution.co.uk
2018/11/20 全球购物
党员组织生活会发言材料
2014/10/17 职场文书
党员群众路线整改措施及今后努力方向
2014/10/28 职场文书
2015年建筑工程工作总结
2015/05/13 职场文书
2015年秋季运动会加油稿
2015/07/22 职场文书
虚拟机linux端mysql数据库无法远程访问的解决办法
2021/05/26 MySQL
Redis 彻底禁用RDB持久化操作
2021/07/09 Redis