Python爬虫设置代理IP(图文)


Posted in Python onDecember 23, 2018

在爬虫的过程中,我们经常会遇见很多网站采取了防爬取技术,或者说因为自己采集网站信息的强度和采集速度太大,给对方服务器带去了太多的压力。

如果你一直用同一个代理ip爬取这个网页,很有可能ip会被禁止访问网页,所以基本上做爬虫的都躲不过去ip的问题。

Python爬虫设置代理IP(图文)

1、我们在做爬虫的过程中经常会遇到这样的情况,最初爬虫正常运行,正常爬取数据,一切看起来都是那么美好,然而不久之后可能会出现错误,比如 403 Forbidden,这时候你打开网页一看,可能会看到“您的 IP 访问频率太高”这样的提示。出现这种情况的原因是网站采取了一些反爬虫措施,比如,服务器会检测某个 IP 在单位时间内的请求次数,如果超过了这个阈值,就会直接拒绝服务,返回一些错误信息,这种情况可以称为封 IP。

Python爬虫设置代理IP(图文)

爬虫代理获取

获取IP池其实要找信的过的爬虫代理,我用的就是飞猪爬虫代理  ,优点自然就是使用率高于99%,缺点是没有免费的,0.03元一个IP,一天可以用1000个,一次可以API提取200个 。当然如果你们的用量还不满足可以加! 

Python爬虫设置代理IP(图文)

Python爬虫设置代理IP(图文)

爬虫代理IP的使用

运行上面的代码会得到一个随机的proxies,把它直接传入requests的get方法中即可。

Python爬虫设置代理IP(图文)

Python爬虫设置代理IP(图文)

1、测试效果

本次测试得出的结论:飞猪IP爬虫代理,可用率、响应速度、稳定性、价格、安全性、使用频率,还是不错的,值得推荐

Python爬虫设置代理IP(图文)

总结:以上就是关于python爬虫设置代理IP的步骤内容,感谢大家的阅读和对三水点靠木的支持。

Python 相关文章推荐
基于Python的身份证号码自动生成程序
Aug 15 Python
python中sleep函数用法实例分析
Apr 29 Python
python中abs&map&reduce简介
Feb 20 Python
Python3.x爬虫下载网页图片的实例讲解
May 22 Python
Pyqt QImage 与 np array 转换方法
Jun 27 Python
Django中create和save方法的不同
Aug 13 Python
python中下标和切片的使用方法解析
Aug 27 Python
Python面向对象封装操作案例详解
Dec 31 Python
TensorFlow tensor的拼接实例
Jan 19 Python
TensorFlow获取加载模型中的全部张量名称代码
Feb 11 Python
Python中itertools库的四个函数介绍
Apr 06 Python
Python tensorflow卷积神经Inception V3网络结构
May 06 Python
celery4+django2定时任务的实现代码
Dec 23 #Python
python3使用pandas获取股票数据的方法
Dec 22 #Python
Python实现将通信达.day文件读取为DataFrame
Dec 22 #Python
python3 cvs将数据读取为字典的方法
Dec 22 #Python
python将txt等文件中的数据读为numpy数组的方法
Dec 22 #Python
python将txt文件读取为字典的示例
Dec 22 #Python
Python3实现对列表按元组指定列进行排序的方法分析
Dec 22 #Python
You might like
个人站长制做网页常用的php代码
2007/03/03 PHP
Thinkphp和Bootstrap结合打造个性的分页样式(推荐)
2016/08/01 PHP
php修改数组键名的方法示例
2017/04/15 PHP
PHP魔术方法之__call与__callStatic使用方法
2017/07/23 PHP
JS BASE64编码 window.atob(), window.btoa()
2021/03/09 Javascript
JS支持带x身份证号码验证函数
2008/08/10 Javascript
不用构造函数(Constructor)new关键字也能实现JavaScript的面向对象
2013/01/11 Javascript
Javascript:为input设置readOnly属性(示例讲解)
2013/12/25 Javascript
js文件Cookie存取值示例代码
2014/02/20 Javascript
JavaScript实现存储HTML字符串示例
2014/04/21 Javascript
jquery操作select方法汇总
2015/02/05 Javascript
jQuery和JavaScript节点插入元素的方法对比
2016/11/18 Javascript
详解Vue中使用v-for语句抛出错误的解决方案
2017/05/04 Javascript
nodejs 如何手动实现服务器
2018/08/20 NodeJs
BootStrap modal实现拖拽功能
2018/12/01 Javascript
jquery实现点击弹出对话框
2020/02/08 jQuery
[02:50]【扭转乾坤,只此一招】DOTA2全新版本永雾林渊开启新篇章
2020/12/24 DOTA
Python学习入门之区块链详解
2017/07/25 Python
Python插件virtualenv搭建虚拟环境
2017/11/20 Python
python实现数据导出到excel的示例--普通格式
2018/05/03 Python
13个Pandas实用技巧,助你提高开发效率
2020/08/19 Python
python安装cx_Oracle和wxPython的方法
2020/09/14 Python
Madda Fella官网:美国冒险家服装品牌
2020/01/16 全球购物
财务管理专业应届毕业生求职信
2013/09/22 职场文书
优秀大学生的自我评价
2014/01/16 职场文书
酒店中秋节活动方案
2014/01/31 职场文书
项目合作协议书范本
2014/04/16 职场文书
志愿者活动总结
2014/04/28 职场文书
法院干警四风问题个人对照检查材料思想汇报
2014/10/07 职场文书
计算机实训报告范文
2014/11/05 职场文书
2015年端午节国旗下演讲稿
2015/03/19 职场文书
2016年优秀党员教师先进事迹材料
2016/02/29 职场文书
某某幼儿园的教育教学管理调研分析报告
2019/11/29 职场文书
go语言中切片与内存复制 memcpy 的实现操作
2021/04/27 Golang
React 并发功能体验(前端的并发模式)
2021/07/01 Javascript
Mysql将字符串按照指定字符分割的正确方法
2022/05/30 MySQL