python爬虫简单的添加代理进行访问的实现代码


Posted in Python onApril 04, 2019

在使用python对网页进行多次快速爬取的时候,访问次数过于频繁,服务器不会考虑User-Agent的信息,会直接把你视为爬虫,从而过滤掉,拒绝你的访问,在这种时候就需要设置代理,我们可以给proxies属性设置一个代理的IP地址,代码如下:

import requests
 from lxml import etree
 url = "https://www.ip.cn"
 headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36 OPR/57.0.3098.116", }
 pro = {
 # 'https': 'https://118.122.92.252:37901', #四川省成都市 电信
 'https': 'https://27.17.45.90:43411', #湖北省武汉市 电信
 }
 try:
 response = requests.get(url, headers=headers, proxies=pro)
 html_str = response.content.decode()
 # print(html_str)
 html = etree.HTML(html_str)
 message = html.xpath("//div[@class='well']//p/text()")
 ip = html.xpath("//div[@class='well']//p/code/text()")
 eng = html.xpath("//div[@class='well']/p/text()")
 print(message[0]+ip[0])
 print(message[1]+ip[1])
 print(eng[2])
 except requests.exceptions.ProxyError as e:
 print("当前代理异常")
 except:
 print("当前请求异常")

在上面的代码中,调用requests库,对一个IP地址查询网页进行访问,随后使用lxml库的xpath对网页进行分析提取,返回用户访问此网页时自己的IP地址,如果代理设置成功,则会返回你的信息和IP地址,如下:

python爬虫简单的添加代理进行访问的实现代码

如果代理失败则会返回异常,在代码中使用了捕获异常,则会返回设置的提示信息,"当前代理异常",如果不是代理的错误则是"当前请求异常"

python爬虫简单的添加代理进行访问的实现代码

PS:免费的代理不是很稳定,在确认代码无误后,如果仍然返回异常,可尝试更换代理IP...

总结

以上所述是小编给大家介绍的python爬虫简单的添加代理进行访问的实现代码,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python的Flask框架中@app.route的用法教程
Mar 31 Python
Python中生成器和yield语句的用法详解
Apr 17 Python
python中lambda与def用法对比实例分析
Apr 30 Python
Python实现对百度云的文件上传(实例讲解)
Oct 21 Python
python数据类型判断type与isinstance的区别实例解析
Oct 31 Python
python环形单链表的约瑟夫问题详解
Sep 27 Python
Python文件循环写入行时防止覆盖的解决方法
Nov 09 Python
python取余运算符知识点详解
Jun 27 Python
使用 tf.nn.dynamic_rnn 展开时间维度方式
Jan 21 Python
详解Python 中的容器 collections
Aug 17 Python
python 爬虫网页登陆的简单实现
Nov 30 Python
Python排序算法之插入排序及其优化方案详解
Jun 11 Python
Django项目中添加ldap登陆认证功能的实现
Apr 04 #Python
使用 Python 玩转 GitHub 的贡献板(推荐)
Apr 04 #Python
python中yield的用法详解——最简单,最清晰的解释
Apr 04 #Python
详解python项目实战:模拟登陆CSDN
Apr 04 #Python
Python实现字符串匹配的KMP算法
Apr 04 #Python
Python GUI编程完整示例
Apr 04 #Python
Python使用sax模块解析XML文件示例
Apr 04 #Python
You might like
用来解析.htpasswd文件的PHP类
2012/09/05 PHP
php操作xml并将其插入数据库的实现方法
2016/09/08 PHP
PHP+原生态ajax实现的省市联动功能详解
2017/08/15 PHP
php 输出缓冲 Output Control用法实例详解
2020/03/03 PHP
jquery dialog open后,服务器端控件失效的快速解决方法
2013/12/19 Javascript
JQuery中DOM事件冒泡实例分析
2015/06/13 Javascript
详解在AngularJS的controller外部直接获取$scope
2017/06/02 Javascript
js操作table中tr的顺序实现上移下移一行的效果
2018/11/22 Javascript
Node.js中Koa2在控制台输出请求日志的方法示例
2019/05/02 Javascript
ES6中let、const的区别及变量的解构赋值操作方法实例分析
2019/10/15 Javascript
node.JS的crypto加密模块使用方法详解(MD5,AES,Hmac,Diffie-Hellman加密)
2020/02/06 Javascript
Vue 实现拨打电话操作
2020/11/16 Javascript
js回到页面指定位置的三种方式
2020/12/17 Javascript
[03:49]DOTA2 2015国际邀请赛中国区预选赛第二日现场百态
2015/05/27 DOTA
Python中zip()函数用法实例教程
2014/07/31 Python
python自定义类并使用的方法
2015/05/07 Python
python中Apriori算法实现讲解
2017/12/10 Python
python微信公众号之关注公众号自动回复
2018/10/25 Python
python批量替换文件名中的共同字符实例
2020/03/05 Python
如何向scrapy中的spider传递参数的几种方法
2020/11/18 Python
奇怪的鱼:Weird Fish
2018/03/18 全球购物
Ariat官网:美国马靴和服装品牌
2019/12/16 全球购物
美国工业用品采购网站:Zoro.com
2020/10/27 全球购物
blueseventy官网:铁人三项和比赛泳衣
2021/02/06 全球购物
办公室前台的岗位职责
2013/12/20 职场文书
最新的咖啡店创业计划书
2013/12/30 职场文书
计算机专业毕业生自荐信
2013/12/31 职场文书
小学教师国培感言
2014/02/08 职场文书
学生周末长期请假条
2014/02/15 职场文书
《奇妙的国际互联网》 教学反思
2014/02/25 职场文书
优秀教师自我评价范文
2014/09/27 职场文书
教师群众路线剖析材料
2014/09/29 职场文书
村党的群众路线教育实践活动工作总结
2014/10/25 职场文书
财务会计实训报告
2014/11/05 职场文书
实习证明格式范文
2015/06/16 职场文书
Python合并多张图片成PDF
2021/06/09 Python