python爬虫简单的添加代理进行访问的实现代码


Posted in Python onApril 04, 2019

在使用python对网页进行多次快速爬取的时候,访问次数过于频繁,服务器不会考虑User-Agent的信息,会直接把你视为爬虫,从而过滤掉,拒绝你的访问,在这种时候就需要设置代理,我们可以给proxies属性设置一个代理的IP地址,代码如下:

import requests
 from lxml import etree
 url = "https://www.ip.cn"
 headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36 OPR/57.0.3098.116", }
 pro = {
 # 'https': 'https://118.122.92.252:37901', #四川省成都市 电信
 'https': 'https://27.17.45.90:43411', #湖北省武汉市 电信
 }
 try:
 response = requests.get(url, headers=headers, proxies=pro)
 html_str = response.content.decode()
 # print(html_str)
 html = etree.HTML(html_str)
 message = html.xpath("//div[@class='well']//p/text()")
 ip = html.xpath("//div[@class='well']//p/code/text()")
 eng = html.xpath("//div[@class='well']/p/text()")
 print(message[0]+ip[0])
 print(message[1]+ip[1])
 print(eng[2])
 except requests.exceptions.ProxyError as e:
 print("当前代理异常")
 except:
 print("当前请求异常")

在上面的代码中,调用requests库,对一个IP地址查询网页进行访问,随后使用lxml库的xpath对网页进行分析提取,返回用户访问此网页时自己的IP地址,如果代理设置成功,则会返回你的信息和IP地址,如下:

python爬虫简单的添加代理进行访问的实现代码

如果代理失败则会返回异常,在代码中使用了捕获异常,则会返回设置的提示信息,"当前代理异常",如果不是代理的错误则是"当前请求异常"

python爬虫简单的添加代理进行访问的实现代码

PS:免费的代理不是很稳定,在确认代码无误后,如果仍然返回异常,可尝试更换代理IP...

总结

以上所述是小编给大家介绍的python爬虫简单的添加代理进行访问的实现代码,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python返回真假值(True or False)小技巧
Apr 10 Python
Python中正则表达式的详细教程
Apr 30 Python
Python 基础教程之闭包的使用方法
Sep 29 Python
Python如何生成树形图案
Jan 03 Python
利用TensorFlow训练简单的二分类神经网络模型的方法
Mar 05 Python
python得到windows自启动列表的方法
Oct 14 Python
Face++ API实现手势识别系统设计
Nov 21 Python
Python笔记之观察者模式
Nov 20 Python
用python中的matplotlib绘制方程图像代码
Nov 21 Python
python使用scapy模块实现ping扫描的过程详解
Jan 21 Python
Python中npy和mat文件的保存与读取
Apr 24 Python
python如何将mat文件转为png
Jul 15 Python
Django项目中添加ldap登陆认证功能的实现
Apr 04 #Python
使用 Python 玩转 GitHub 的贡献板(推荐)
Apr 04 #Python
python中yield的用法详解——最简单,最清晰的解释
Apr 04 #Python
详解python项目实战:模拟登陆CSDN
Apr 04 #Python
Python实现字符串匹配的KMP算法
Apr 04 #Python
Python GUI编程完整示例
Apr 04 #Python
Python使用sax模块解析XML文件示例
Apr 04 #Python
You might like
php中根据变量的类型 选择echo或dump
2012/07/05 PHP
Yii2框架视图(View)操作及Layout的使用方法分析
2019/05/27 PHP
PHP重载基础知识回顾
2020/09/10 PHP
jquer之ajaxQueue简单实现代码
2011/09/15 Javascript
Jquery实现自定义窗口随意的拖拽
2014/03/12 Javascript
jQuery实现图片轮播效果代码
2016/09/27 Javascript
原生JS实现《别踩白块》游戏(兼容IE)
2017/02/20 Javascript
vue实现消息的无缝滚动效果的示例代码
2017/12/05 Javascript
微信小程序webview实现长按点击识别二维码功能示例
2019/01/24 Javascript
浅谈vue限制文本框输入数字的正确姿势
2019/09/02 Javascript
ES2020系列之空值合并运算符 '??'
2020/07/22 Javascript
[02:43]2018DOTA2亚洲邀请赛主赛事首日TOP5
2018/04/04 DOTA
[04:14]从西雅图到上海——玩家自制DOTA2主题歌曲应援TI9
2019/07/11 DOTA
用Python实现一个简单的线程池
2015/04/07 Python
Python类的继承和多态代码详解
2017/12/27 Python
python 爬虫一键爬取 淘宝天猫宝贝页面主图颜色图和详情图的教程
2018/05/22 Python
Django使用模板后无法找到静态资源文件问题解决
2019/07/19 Python
django实现用户注册实例讲解
2019/10/30 Python
详解Python3 定义一个跨越多行的字符串的多种方法
2020/09/06 Python
Python关于拓扑排序知识点讲解
2021/01/04 Python
Python爬取你好李焕英豆瓣短评生成词云的示例代码
2021/02/24 Python
使用CSS3代码绘制可爱的Hello Kitty猫
2016/08/03 HTML / CSS
你应该知道的30个css选择器
2014/03/19 HTML / CSS
html5使用canvas画空心圆与实心圆
2014/12/15 HTML / CSS
详解HTML5中rel属性的prefetch预加载功能使用
2016/05/06 HTML / CSS
汇集了世界上最好的天然和有机美容产品:LoveLula
2018/02/05 全球购物
美国眼镜在线零售商:Dualens
2019/12/07 全球购物
业务经理岗位职责
2013/11/11 职场文书
大学生村官工作感言
2014/01/10 职场文书
初三开学计划书
2014/04/27 职场文书
学校文明单位申报材料
2014/05/06 职场文书
绿色校园广播稿
2014/10/13 职场文书
匿名检举信范文
2015/03/02 职场文书
cf战队宣传语
2015/07/13 职场文书
2016年党建工作简报
2015/11/26 职场文书
CSS实现背景图片全屏铺满自适应的3种方式
2022/07/07 HTML / CSS