Python爬虫设置代理IP(图文)


Posted in Python onDecember 23, 2018

在爬虫的过程中,我们经常会遇见很多网站采取了防爬取技术,或者说因为自己采集网站信息的强度和采集速度太大,给对方服务器带去了太多的压力。

如果你一直用同一个代理ip爬取这个网页,很有可能ip会被禁止访问网页,所以基本上做爬虫的都躲不过去ip的问题。

Python爬虫设置代理IP(图文)

1、我们在做爬虫的过程中经常会遇到这样的情况,最初爬虫正常运行,正常爬取数据,一切看起来都是那么美好,然而不久之后可能会出现错误,比如 403 Forbidden,这时候你打开网页一看,可能会看到“您的 IP 访问频率太高”这样的提示。出现这种情况的原因是网站采取了一些反爬虫措施,比如,服务器会检测某个 IP 在单位时间内的请求次数,如果超过了这个阈值,就会直接拒绝服务,返回一些错误信息,这种情况可以称为封 IP。

Python爬虫设置代理IP(图文)

爬虫代理获取

获取IP池其实要找信的过的爬虫代理,我用的就是飞猪爬虫代理  ,优点自然就是使用率高于99%,缺点是没有免费的,0.03元一个IP,一天可以用1000个,一次可以API提取200个 。当然如果你们的用量还不满足可以加! 

Python爬虫设置代理IP(图文)

Python爬虫设置代理IP(图文)

爬虫代理IP的使用

运行上面的代码会得到一个随机的proxies,把它直接传入requests的get方法中即可。

Python爬虫设置代理IP(图文)

Python爬虫设置代理IP(图文)

1、测试效果

本次测试得出的结论:飞猪IP爬虫代理,可用率、响应速度、稳定性、价格、安全性、使用频率,还是不错的,值得推荐

Python爬虫设置代理IP(图文)

总结:以上就是关于python爬虫设置代理IP的步骤内容,感谢大家的阅读和对三水点靠木的支持。

Python 相关文章推荐
下载糗事百科的内容_python版
Dec 07 Python
一个基于flask的web应用诞生 bootstrap框架美化(3)
Apr 11 Python
python分批定量读取文件内容,输出到不同文件中的方法
Dec 08 Python
对python PLT中的image和skimage处理图片方法详解
Jan 10 Python
Django框架文件上传与自定义图片上传路径、上传文件名操作分析
May 10 Python
介绍一款python类型检查工具pyright(推荐)
Jul 03 Python
django-rest-framework 自定义swagger过程详解
Jul 18 Python
Python中函数的返回值示例浅析
Aug 28 Python
python zip()函数使用方法解析
Oct 31 Python
Pytorch训练过程出现nan的解决方式
Jan 02 Python
python pprint模块中print()和pprint()两者的区别
Feb 10 Python
Numpy 理解ndarray对象的示例代码
Apr 03 Python
celery4+django2定时任务的实现代码
Dec 23 #Python
python3使用pandas获取股票数据的方法
Dec 22 #Python
Python实现将通信达.day文件读取为DataFrame
Dec 22 #Python
python3 cvs将数据读取为字典的方法
Dec 22 #Python
python将txt等文件中的数据读为numpy数组的方法
Dec 22 #Python
python将txt文件读取为字典的示例
Dec 22 #Python
Python3实现对列表按元组指定列进行排序的方法分析
Dec 22 #Python
You might like
php checkdate、getdate等日期时间函数操作详解
2010/03/11 PHP
PHP 命令行工具 shell_exec, exec, passthru, system详细使用介绍
2011/09/11 PHP
Linux系统下PHP-FPM的安装和配置教程
2015/08/17 PHP
PHP入门教程之日期与时间操作技巧总结(格式化,验证,获取,转换,计算等)
2016/09/11 PHP
PHP CURL中传递cookie的方法步骤
2019/05/09 PHP
基于Bootstrap实现tab标签切换效果
2020/04/15 Javascript
简述vue状态管理模式之vuex
2018/08/29 Javascript
vue实现todolist基本功能以及数据存储功能实例详解
2019/04/11 Javascript
js blob类型url的视频下载问题的解决
2019/11/29 Javascript
JavaScript实现弹出窗口效果
2020/12/09 Javascript
python通过colorama模块在控制台输出彩色文字的方法
2015/03/19 Python
在GitHub Pages上使用Pelican搭建博客的教程
2015/04/25 Python
Python WXPY实现微信监控报警功能的代码
2017/10/20 Python
Python设计模式之MVC模式简单示例
2018/01/10 Python
简单谈谈Python的pycurl模块
2018/04/07 Python
Python实现基于POS算法的区块链
2018/08/07 Python
使用Python轻松完成垃圾分类(基于图像识别)
2019/07/09 Python
Python OpenCV调用摄像头检测人脸并截图
2020/08/20 Python
python实现本地批量ping多个IP的方法示例
2019/08/07 Python
python递归下载文件夹下所有文件
2019/08/31 Python
python图形绘制奥运五环实例讲解
2019/09/14 Python
浅析PEP570新语法: 只接受位置参数
2019/10/15 Python
python对指定字符串逆序的6种方法(小结)
2020/04/02 Python
印度最大的酒店品牌网络:OYO Rooms
2016/07/24 全球购物
Myprotein瑞典官方网站:畅销欧洲英国运动营养品牌
2018/01/22 全球购物
黄色火烈鸟:De Gele Flamingo
2019/03/18 全球购物
Everlast官网:拳击、综合格斗和健身相关的体育用品
2020/08/03 全球购物
opencv实现图像几何变换
2021/03/24 Python
代理协议书范本
2014/04/22 职场文书
公司演讲稿开场白
2014/08/25 职场文书
行政人事主管岗位职责
2015/04/11 职场文书
广告公司文案策划岗位职责
2015/04/14 职场文书
起诉意见书范文
2015/05/19 职场文书
小学远程教育工作总结
2015/08/13 职场文书
Django migrate报错的解决方案
2021/05/20 Python
MySQL中一条SQL查询语句是如何执行的
2022/04/08 MySQL