Python数据抓取爬虫代理防封IP方法


Posted in Python onDecember 23, 2018

爬虫:一段自动抓取互联网信息的程序,从互联网上抓取对于我们有价值的信息,一般来说,Python爬虫程序很多时候都要使用(飞猪IP)代理的IP地址来爬取程序,但是默认的urlopen是无法使用代理的IP的,我就来分享一下Python爬虫怎样使用代理IP的经验。(推荐飞猪代理IP注册可免费使用,浏览器搜索可找到)

Python数据抓取爬虫代理防封IP方法

1、划重点,小编我用的是Python3哦,所以要导入urllib的request,然后我们调用ProxyHandler,它可以接收代理IP的参数。代理可以根据自己需要选择,当然免费的也是有的,但是可用率可想而知的。(飞猪IP)

Python数据抓取爬虫代理防封IP方法

2、接着把IP地址以字典的形式放入其中,这个IP地址是我乱写的,只是用来举例。设置键为http,当然有些是https的,然后后面就是IP地址以及端口号(9000),具体看你的IP地址是什么类型的,不同IP端口号可能不同根据你在飞猪提取的端口为准。

Python数据抓取爬虫代理防封IP方法

3、接着再用build_opener()来构建一个opener对象。

Python数据抓取爬虫代理防封IP方法

4、然后调用构建好的opener对象里面的open方法来发生请求。实际上urlopen也是类似这样使用内部定义好的opener.open(),这里就相当于我们自己重写。

Python数据抓取爬虫代理防封IP方法

5、当然了,如果我们使用install_opener(),就可以把之前自定义的opener设置成全局的。

Python数据抓取爬虫代理防封IP方法

6、设置成全局之后,如果我们再使用urlopen来发送请求,那么发送请求使用的IP地址就是代理IP,而不是本机的IP地址了。

Python数据抓取爬虫代理防封IP方法

7、最后再来说说使用代理遇到的错误,提示目标计算机积极拒绝,这就说明可能是代理IP无效,或者端口号错误,这就需要使用有效的IP才行哦。(这边现在是乱填写的IP地址)可选择飞猪的代理IP。

Python数据抓取爬虫代理防封IP方法

总结:以上就是本次关于Python数据抓取爬虫代理防封IP方法,感谢大家的阅读和对三水点靠木的支持。

Python 相关文章推荐
python 安装virtualenv和virtualenvwrapper的方法
Jan 13 Python
Python入门之三角函数tan()函数实例详解
Nov 08 Python
Python实现七彩蟒蛇绘制实例代码
Jan 16 Python
Django如何自定义model创建数据库索引的顺序
Jun 20 Python
python 列表转为字典的两个小方法(小结)
Jun 28 Python
python调试神器PySnooper的使用
Jul 03 Python
python xlwt如何设置单元格的自定义背景颜色
Sep 03 Python
python系统指定文件的查找只输出目录下所有文件及文件夹
Jan 19 Python
keras模型可视化,层可视化及kernel可视化实例
Jan 24 Python
如何写python的配置文件
Jun 07 Python
Pytorch学习之torch用法----比较操作(Comparison Ops)
Jun 28 Python
Sublime Text3最新激活注册码分享适用2020最新版 亲测可用
Nov 12 Python
python3爬虫怎样构建请求header
Dec 23 #Python
windows下搭建python scrapy爬虫框架步骤
Dec 23 #Python
python构建基础的爬虫教学
Dec 23 #Python
Flask之请求钩子的实现
Dec 23 #Python
python爬虫获取新浪新闻教学
Dec 23 #Python
Python爬虫文件下载图文教程
Dec 23 #Python
python爬虫获取百度首页内容教学
Dec 23 #Python
You might like
基于文本的访客签到簿
2006/10/09 PHP
php 生成静态页面的办法与实现代码详细版
2010/02/15 PHP
PHP和.net中des加解密的实现方法
2013/02/27 PHP
php获取数组长度的方法(有实例)
2013/10/27 PHP
ThinkPHP CURD方法之page方法详解
2014/06/18 PHP
Eclipse的PHP插件PHPEclipse安装和使用
2014/07/20 PHP
PHP对XML内容进行修改和删除实例代码
2016/10/26 PHP
PHP使用PDO、mysqli扩展实现与数据库交互操作详解
2019/07/20 PHP
jquery tools之tabs 选项卡/页签
2009/07/25 Javascript
深入探讨javascript函数式编程
2015/10/11 Javascript
jQuery实现简单的手风琴效果
2020/04/17 jQuery
vue数据双向绑定的注意点
2017/06/23 Javascript
AngularJS实现表单元素值绑定操作示例
2017/10/11 Javascript
浅谈MUI框架中加载外部网页或服务器数据的方法
2018/01/31 Javascript
jQuery中可见性过滤器简单用法示例
2018/03/31 jQuery
vue2中引用及使用 better-scroll的方法详解
2018/11/15 Javascript
Vue自定义指令写法与个人理解
2019/02/09 Javascript
微信小程序图表插件wx-charts用法实例详解
2019/05/20 Javascript
Vue之Mixins(混入)的使用方法
2019/09/24 Javascript
python处理圆角图片、圆形图片的例子
2014/04/25 Python
python闭包、深浅拷贝、垃圾回收、with语句知识点汇总
2020/03/11 Python
pip install命令安装扩展库整理
2021/03/02 Python
CSS3中设置3D变形的transform-style属性详解
2016/05/23 HTML / CSS
长青弘远的面试题
2012/06/09 面试题
《鞋匠的儿子》教学反思
2014/03/02 职场文书
《鹬蚌相争》教学反思
2014/04/22 职场文书
竞选班干部的演讲稿
2014/04/24 职场文书
需求分析说明书
2014/05/09 职场文书
村党支部书记承诺书
2014/05/29 职场文书
公民代理授权委托书
2014/09/24 职场文书
圣诞节开幕词
2015/01/29 职场文书
电影圆明园观后感
2015/06/03 职场文书
求职信:会计求职的写作技巧
2019/04/24 职场文书
Java字符缓冲流BufferedWriter
2022/04/09 Java/Android
MySQL 语句执行顺序举例解析
2022/06/05 MySQL
Mysql中mvcc各场景理解应用
2022/08/05 MySQL