python爬虫简单的添加代理进行访问的实现代码


Posted in Python onApril 04, 2019

在使用python对网页进行多次快速爬取的时候,访问次数过于频繁,服务器不会考虑User-Agent的信息,会直接把你视为爬虫,从而过滤掉,拒绝你的访问,在这种时候就需要设置代理,我们可以给proxies属性设置一个代理的IP地址,代码如下:

import requests
 from lxml import etree
 url = "https://www.ip.cn"
 headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36 OPR/57.0.3098.116", }
 pro = {
 # 'https': 'https://118.122.92.252:37901', #四川省成都市 电信
 'https': 'https://27.17.45.90:43411', #湖北省武汉市 电信
 }
 try:
 response = requests.get(url, headers=headers, proxies=pro)
 html_str = response.content.decode()
 # print(html_str)
 html = etree.HTML(html_str)
 message = html.xpath("//div[@class='well']//p/text()")
 ip = html.xpath("//div[@class='well']//p/code/text()")
 eng = html.xpath("//div[@class='well']/p/text()")
 print(message[0]+ip[0])
 print(message[1]+ip[1])
 print(eng[2])
 except requests.exceptions.ProxyError as e:
 print("当前代理异常")
 except:
 print("当前请求异常")

在上面的代码中,调用requests库,对一个IP地址查询网页进行访问,随后使用lxml库的xpath对网页进行分析提取,返回用户访问此网页时自己的IP地址,如果代理设置成功,则会返回你的信息和IP地址,如下:

python爬虫简单的添加代理进行访问的实现代码

如果代理失败则会返回异常,在代码中使用了捕获异常,则会返回设置的提示信息,"当前代理异常",如果不是代理的错误则是"当前请求异常"

python爬虫简单的添加代理进行访问的实现代码

PS:免费的代理不是很稳定,在确认代码无误后,如果仍然返回异常,可尝试更换代理IP...

总结

以上所述是小编给大家介绍的python爬虫简单的添加代理进行访问的实现代码,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Django集成百度富文本编辑器uEditor攻略
Jul 04 Python
python通过ssh-powershell监控windows的方法
Jun 02 Python
matplotlib绘图实例演示标记路径
Jan 23 Python
Python高级特性切片(Slice)操作详解
Sep 27 Python
20行python代码实现人脸识别
May 05 Python
简单了解python协程的相关知识
Aug 31 Python
python绘制BA无标度网络示例代码
Nov 21 Python
Pytorch之parameters的使用
Dec 31 Python
python计算导数并绘图的实例
Feb 29 Python
Python多线程多进程实例对比解析
Mar 12 Python
Django DRF认证组件流程实现原理详解
Aug 17 Python
Windows环境下Python3.6.8 importError: DLLload failed:找不到指定的模块
Nov 01 Python
Django项目中添加ldap登陆认证功能的实现
Apr 04 #Python
使用 Python 玩转 GitHub 的贡献板(推荐)
Apr 04 #Python
python中yield的用法详解——最简单,最清晰的解释
Apr 04 #Python
详解python项目实战:模拟登陆CSDN
Apr 04 #Python
Python实现字符串匹配的KMP算法
Apr 04 #Python
Python GUI编程完整示例
Apr 04 #Python
Python使用sax模块解析XML文件示例
Apr 04 #Python
You might like
DSP接收机前端设想
2021/03/02 无线电
php入门学习知识点一 PHP与MYSql连接与查询
2011/07/14 PHP
解析coreseek for sphinx的使用
2013/06/21 PHP
yii2.0之GridView自定义按钮和链接用法
2014/12/15 PHP
PHP数组操作――获取数组最后一个值的方法
2015/04/14 PHP
php获取服务器操作系统相关信息的方法
2016/10/08 PHP
php模拟实现斗地主发牌
2020/04/22 PHP
HTML中不支持静态Expando的元素的问题
2007/03/08 Javascript
Google 静态地图API实现代码
2010/11/19 Javascript
基于JavaScript实现继承机制之原型链(prototype chaining)的详解
2013/05/07 Javascript
固定背景实现的背景滚动特效示例分享
2013/05/19 Javascript
js 自动播放的实例代码
2013/11/19 Javascript
利用JQuery和Servlet实现跨域提交请求示例分享
2014/02/12 Javascript
改变状态栏文字的js代码
2014/06/13 Javascript
jquery+php实现搜索框自动提示
2014/11/28 Javascript
AngularJS基础知识
2014/12/21 Javascript
JS如何设置cookie有效期为当天24点并弹出欢迎登陆界面
2016/08/04 Javascript
Nodejs+express+ejs简单使用实例代码
2017/09/18 NodeJs
如何使node也支持从url加载一个module详解
2018/06/05 Javascript
vue+mousemove实现鼠标拖动功能(拖动过快失效问题解决方法)
2018/08/24 Javascript
Vue-Router的使用方法
2018/09/05 Javascript
浅入深出Vue之组件使用
2019/07/11 Javascript
JS实现canvas简单小画板功能
2020/06/23 Javascript
详细介绍Python语言中的按位运算符
2013/11/26 Python
详解Python3.6安装psutil模块和功能简介
2018/05/30 Python
解决使用pycharm提交代码时冲突之后文件丢失找回的方法
2018/08/05 Python
Centos7下源码安装Python3 及shell 脚本自动安装Python3的教程
2020/03/07 Python
美国知名的时尚购物网站:Anthropologie
2016/12/22 全球购物
美国女性运动零售品牌:Lady Foot Locker
2017/05/12 全球购物
纽约香氛品牌:NEST Fragrance
2018/10/15 全球购物
意大利在线药房:Saninforma
2021/02/11 全球购物
报关简历自我评价怎么写
2013/09/19 职场文书
工程部经理岗位职责
2013/12/08 职场文书
基层党员对照检查材料
2014/09/24 职场文书
单位推荐信范文
2015/03/27 职场文书
大学生创业,为什么都会选择快餐饮?
2019/08/08 职场文书