Python爬虫设置代理IP(图文)


Posted in Python onDecember 23, 2018

在爬虫的过程中,我们经常会遇见很多网站采取了防爬取技术,或者说因为自己采集网站信息的强度和采集速度太大,给对方服务器带去了太多的压力。

如果你一直用同一个代理ip爬取这个网页,很有可能ip会被禁止访问网页,所以基本上做爬虫的都躲不过去ip的问题。

Python爬虫设置代理IP(图文)

1、我们在做爬虫的过程中经常会遇到这样的情况,最初爬虫正常运行,正常爬取数据,一切看起来都是那么美好,然而不久之后可能会出现错误,比如 403 Forbidden,这时候你打开网页一看,可能会看到“您的 IP 访问频率太高”这样的提示。出现这种情况的原因是网站采取了一些反爬虫措施,比如,服务器会检测某个 IP 在单位时间内的请求次数,如果超过了这个阈值,就会直接拒绝服务,返回一些错误信息,这种情况可以称为封 IP。

Python爬虫设置代理IP(图文)

爬虫代理获取

获取IP池其实要找信的过的爬虫代理,我用的就是飞猪爬虫代理  ,优点自然就是使用率高于99%,缺点是没有免费的,0.03元一个IP,一天可以用1000个,一次可以API提取200个 。当然如果你们的用量还不满足可以加! 

Python爬虫设置代理IP(图文)

Python爬虫设置代理IP(图文)

爬虫代理IP的使用

运行上面的代码会得到一个随机的proxies,把它直接传入requests的get方法中即可。

Python爬虫设置代理IP(图文)

Python爬虫设置代理IP(图文)

1、测试效果

本次测试得出的结论:飞猪IP爬虫代理,可用率、响应速度、稳定性、价格、安全性、使用频率,还是不错的,值得推荐

Python爬虫设置代理IP(图文)

总结:以上就是关于python爬虫设置代理IP的步骤内容,感谢大家的阅读和对三水点靠木的支持。

Python 相关文章推荐
python通过openpyxl生成Excel文件的方法
May 12 Python
Python可变参数用法实例分析
Apr 02 Python
Python模拟用户登录验证
Sep 11 Python
python shell根据ip获取主机名代码示例
Nov 25 Python
python学习--使用QQ邮箱发送邮件代码实例
Apr 16 Python
Pycharm 安装 idea VIM插件的图文教程详解
Feb 21 Python
Jupyter notebook如何修改平台字体
May 13 Python
Django 解决上传文件时,request.FILES为空的问题
May 20 Python
在pycharm中关掉ipython console/PyDev操作
Jun 09 Python
Django框架安装及项目创建过程解析
Sep 14 Python
忆童年!用Python实现愤怒的小鸟游戏
Jun 07 Python
python中 Flask Web 表单的使用方法
May 20 Python
celery4+django2定时任务的实现代码
Dec 23 #Python
python3使用pandas获取股票数据的方法
Dec 22 #Python
Python实现将通信达.day文件读取为DataFrame
Dec 22 #Python
python3 cvs将数据读取为字典的方法
Dec 22 #Python
python将txt等文件中的数据读为numpy数组的方法
Dec 22 #Python
python将txt文件读取为字典的示例
Dec 22 #Python
Python3实现对列表按元组指定列进行排序的方法分析
Dec 22 #Python
You might like
PHP新手上路(七)
2006/10/09 PHP
PHP 批量删除数据的方法分析
2009/10/30 PHP
php通过记录IP来防止表单重复提交方法分析
2014/12/16 PHP
在WordPress中使用wp-cron插件来设置定时任务
2015/12/10 PHP
PHP中利用sleep函数实现定时执行功能实现代码
2016/08/25 PHP
PHP AjaxForm提交图片上传并显示图片源码
2016/11/29 PHP
extjs 学习笔记(一) 一些基础知识
2009/10/13 Javascript
使用Microsoft Ajax Minifier减小JavaScript文件大小的方法
2010/04/01 Javascript
用js读、写、删除Cookie代码分享及详细注释说明
2014/06/05 Javascript
JS实现黑色大气的二级导航菜单效果
2015/09/18 Javascript
JavaScript检测原始值、引用值、属性
2016/06/20 Javascript
微信小程序-详解数据缓存
2016/11/24 Javascript
H5上传本地图片并预览功能
2017/05/08 Javascript
页面间固定参数,通过cookie传值的实现方法
2017/05/31 Javascript
JS去掉字符串中所有的逗号
2017/10/18 Javascript
对angularJs中ng-style动态改变样式的实例讲解
2018/09/30 Javascript
微信小程序接入腾讯云验证码的方法步骤
2020/01/07 Javascript
Element的el-tree控件后台数据结构的生成以及方法的抽取
2020/03/05 Javascript
在Vue.js中使用TypeScript的方法
2020/03/19 Javascript
vue实现在进行增删改操作后刷新页面
2020/08/05 Javascript
Python获取脚本所在目录的正确方法
2014/04/15 Python
Python代码块批量添加Tab缩进的方法
2018/06/25 Python
pycharm执行python时,填写参数的方法
2018/10/29 Python
对python指数、幂数拟合curve_fit详解
2018/12/29 Python
python多线程扫描端口(线程池)
2019/09/04 Python
MNIST数据集转化为二维图片的实现示例
2020/01/10 Python
Ubuntu20下的Django安装的方法步骤
2021/01/24 Python
利用CSS3实现的文字定时向上滚动
2016/08/29 HTML / CSS
浅析HTML5 Landmark
2020/09/11 HTML / CSS
材料采购员岗位职责
2013/12/17 职场文书
社区矫正工作方案
2014/06/04 职场文书
暑期培训心得体会
2014/09/02 职场文书
公务员四风问题对照检查材料整改措施
2014/09/26 职场文书
Java实现房屋出租系统详解
2021/10/05 Java/Android
JavaScript实现栈结构详细过程
2021/12/06 Javascript
漫画「古见同学有交流障碍症」第25卷封面公开
2022/03/21 日漫