Python爬虫设置代理IP(图文)


Posted in Python onDecember 23, 2018

在爬虫的过程中,我们经常会遇见很多网站采取了防爬取技术,或者说因为自己采集网站信息的强度和采集速度太大,给对方服务器带去了太多的压力。

如果你一直用同一个代理ip爬取这个网页,很有可能ip会被禁止访问网页,所以基本上做爬虫的都躲不过去ip的问题。

Python爬虫设置代理IP(图文)

1、我们在做爬虫的过程中经常会遇到这样的情况,最初爬虫正常运行,正常爬取数据,一切看起来都是那么美好,然而不久之后可能会出现错误,比如 403 Forbidden,这时候你打开网页一看,可能会看到“您的 IP 访问频率太高”这样的提示。出现这种情况的原因是网站采取了一些反爬虫措施,比如,服务器会检测某个 IP 在单位时间内的请求次数,如果超过了这个阈值,就会直接拒绝服务,返回一些错误信息,这种情况可以称为封 IP。

Python爬虫设置代理IP(图文)

爬虫代理获取

获取IP池其实要找信的过的爬虫代理,我用的就是飞猪爬虫代理  ,优点自然就是使用率高于99%,缺点是没有免费的,0.03元一个IP,一天可以用1000个,一次可以API提取200个 。当然如果你们的用量还不满足可以加! 

Python爬虫设置代理IP(图文)

Python爬虫设置代理IP(图文)

爬虫代理IP的使用

运行上面的代码会得到一个随机的proxies,把它直接传入requests的get方法中即可。

Python爬虫设置代理IP(图文)

Python爬虫设置代理IP(图文)

1、测试效果

本次测试得出的结论:飞猪IP爬虫代理,可用率、响应速度、稳定性、价格、安全性、使用频率,还是不错的,值得推荐

Python爬虫设置代理IP(图文)

总结:以上就是关于python爬虫设置代理IP的步骤内容,感谢大家的阅读和对三水点靠木的支持。

Python 相关文章推荐
python设置检查点简单实现代码
Jul 01 Python
python实现获取客户机上指定文件并传输到服务器的方法
Mar 16 Python
Python实现简易Web爬虫详解
Jan 03 Python
Python标准库笔记struct模块的使用
Feb 22 Python
一条命令解决mac版本python IDLE不能输入中文问题
May 15 Python
浅析python中的迭代与迭代对象
Oct 08 Python
解决安装pycharm后不能执行python脚本的问题
Jan 19 Python
浅谈Python 递归算法指归
Aug 22 Python
python多进程(加入进程池)操作常见案例
Oct 21 Python
Python单例模式的四种创建方式实例解析
Mar 04 Python
解决Keras中循环使用K.ctc_decode内存不释放的问题
Jun 29 Python
python opencv通过按键采集图片源码
May 20 Python
celery4+django2定时任务的实现代码
Dec 23 #Python
python3使用pandas获取股票数据的方法
Dec 22 #Python
Python实现将通信达.day文件读取为DataFrame
Dec 22 #Python
python3 cvs将数据读取为字典的方法
Dec 22 #Python
python将txt等文件中的数据读为numpy数组的方法
Dec 22 #Python
python将txt文件读取为字典的示例
Dec 22 #Python
Python3实现对列表按元组指定列进行排序的方法分析
Dec 22 #Python
You might like
全国FM电台频率大全 - 14 江西省
2020/03/11 无线电
上海地方志办公室-上海电子仪表工业志
2021/03/04 无线电
php实现的树形结构数据存取类实例
2014/11/29 PHP
PHP制作用户注册系统
2015/10/23 PHP
PHP用continue跳过本次循环中剩余代码的注意点
2017/06/27 PHP
javascript 关闭IE6、IE7
2009/06/01 Javascript
javascript 添加和移除函数的通用方法
2009/10/20 Javascript
javascript 面向对象,实现namespace,class,继承,重载
2009/10/29 Javascript
jquery 插件学习(五)
2012/08/06 Javascript
js 调用本地exe的例子(支持IE内核的浏览器)
2012/12/26 Javascript
js之事件冒泡和事件捕获详细介绍
2013/10/28 Javascript
javascript自动给文本url地址增加链接的方法分享
2014/01/20 Javascript
再谈Javascript中的基本类型和引用类型(推荐)
2016/07/01 Javascript
jquery checkbox的相关操作总结
2016/10/17 Javascript
jQuery学习笔记之入门
2016/12/14 Javascript
Angular2 组件交互实例详解
2017/08/24 Javascript
微信小程序之圆形进度条实现思路
2018/02/22 Javascript
vue :src 文件路径错误问题的解决方法
2018/05/15 Javascript
layer弹出层取消遮罩的方法
2019/09/25 Javascript
bootstrap实现tab选项卡切换
2020/08/09 Javascript
js实现拖拽元素选择和删除
2020/08/25 Javascript
python有证书的加密解密实现方法
2014/11/19 Python
python批量识别图片指定区域文字内容
2019/04/30 Python
Python 操作 ElasticSearch的完整代码
2019/08/04 Python
Python面向对象封装操作案例详解
2019/12/31 Python
pytorch实现seq2seq时对loss进行mask的方式
2020/02/18 Python
Python run()函数和start()函数的比较和差别介绍
2020/05/03 Python
某/etc/fstab文件中的某行如下: /dev/had5 /mnt/dosdata msdos defaults,usrquota 1 2 请解释其含义
2013/09/18 面试题
关于元旦的广播稿
2014/02/16 职场文书
财产保全担保书范文
2014/04/01 职场文书
幼儿园保育员责任书
2014/07/22 职场文书
集体生日活动方案
2014/08/18 职场文书
意外死亡赔偿协议书
2014/10/14 职场文书
师德标兵先进事迹材料
2014/12/19 职场文书
公司晚会主持词
2019/04/17 职场文书
利用python做数据拟合详情
2021/11/17 Python