python爬虫简单的添加代理进行访问的实现代码


Posted in Python onApril 04, 2019

在使用python对网页进行多次快速爬取的时候,访问次数过于频繁,服务器不会考虑User-Agent的信息,会直接把你视为爬虫,从而过滤掉,拒绝你的访问,在这种时候就需要设置代理,我们可以给proxies属性设置一个代理的IP地址,代码如下:

import requests
 from lxml import etree
 url = "https://www.ip.cn"
 headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36 OPR/57.0.3098.116", }
 pro = {
 # 'https': 'https://118.122.92.252:37901', #四川省成都市 电信
 'https': 'https://27.17.45.90:43411', #湖北省武汉市 电信
 }
 try:
 response = requests.get(url, headers=headers, proxies=pro)
 html_str = response.content.decode()
 # print(html_str)
 html = etree.HTML(html_str)
 message = html.xpath("//div[@class='well']//p/text()")
 ip = html.xpath("//div[@class='well']//p/code/text()")
 eng = html.xpath("//div[@class='well']/p/text()")
 print(message[0]+ip[0])
 print(message[1]+ip[1])
 print(eng[2])
 except requests.exceptions.ProxyError as e:
 print("当前代理异常")
 except:
 print("当前请求异常")

在上面的代码中,调用requests库,对一个IP地址查询网页进行访问,随后使用lxml库的xpath对网页进行分析提取,返回用户访问此网页时自己的IP地址,如果代理设置成功,则会返回你的信息和IP地址,如下:

python爬虫简单的添加代理进行访问的实现代码

如果代理失败则会返回异常,在代码中使用了捕获异常,则会返回设置的提示信息,"当前代理异常",如果不是代理的错误则是"当前请求异常"

python爬虫简单的添加代理进行访问的实现代码

PS:免费的代理不是很稳定,在确认代码无误后,如果仍然返回异常,可尝试更换代理IP...

总结

以上所述是小编给大家介绍的python爬虫简单的添加代理进行访问的实现代码,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
python ElementTree 基本读操作示例
Apr 09 Python
使用numba对Python运算加速的方法
Oct 15 Python
python 函数内部修改外部变量的方法
Dec 18 Python
python 实现将多条曲线画在一幅图上的方法
Jul 07 Python
Python 进程之间共享数据(全局变量)的方法
Jul 16 Python
Python笔记之观察者模式
Nov 20 Python
python实现矩阵和array数组之间的转换
Nov 29 Python
Pytorch保存模型用于测试和用于继续训练的区别详解
Jan 10 Python
python3正则模块re的使用方法详解
Feb 11 Python
django中嵌套的try-except实例
May 21 Python
我对PyTorch dataloader里的shuffle=True的理解
May 20 Python
Python实现的扫码工具居然这么好用!
Jun 07 Python
Django项目中添加ldap登陆认证功能的实现
Apr 04 #Python
使用 Python 玩转 GitHub 的贡献板(推荐)
Apr 04 #Python
python中yield的用法详解——最简单,最清晰的解释
Apr 04 #Python
详解python项目实战:模拟登陆CSDN
Apr 04 #Python
Python实现字符串匹配的KMP算法
Apr 04 #Python
Python GUI编程完整示例
Apr 04 #Python
Python使用sax模块解析XML文件示例
Apr 04 #Python
You might like
解析php安全性问题中的:Null 字符问题
2013/06/21 PHP
php中的PHP_EOL换行符详细解析
2013/10/26 PHP
PHP与服务器文件系统的简单交互
2016/10/21 PHP
解决PHP使用CURL发送GET请求时传递参数的问题
2019/10/11 PHP
php下的原生ajax请求用法实例分析
2020/02/28 PHP
thinkphp框架实现路由重定义简化url访问地址的方法分析
2020/04/04 PHP
最简单的jQuery程序 入门者学习
2009/07/09 Javascript
JSChart轻量级图形报表工具(内置函数中文参考)
2010/10/11 Javascript
jQuery 快速结束当前正在执行的动画
2013/11/20 Javascript
js利用事件的阻止冒泡实现点击空白模态框的隐藏
2014/01/24 Javascript
javascript包装对象实例分析
2015/03/27 Javascript
jQuery+CSS实现一个侧滑导航菜单代码
2016/05/09 Javascript
jQuery的中 is(':visible') 解析及用法(必看)
2017/02/12 Javascript
浅谈vue后台管理系统权限控制思考与实践
2018/12/19 Javascript
详解原生JS回到顶部
2019/03/25 Javascript
vue3.0中的双向数据绑定方法及优缺点
2019/08/01 Javascript
express中static中间件的具体使用方法
2019/10/17 Javascript
JavaScript实现切换多张图片
2021/01/27 Javascript
[00:23]DOTA2群星共贺开放测试 25日无码时代来袭
2013/09/23 DOTA
[01:51]2018年度CS GO最具人气外援-完美盛典
2018/12/16 DOTA
bpython 功能强大的Python shell
2016/02/16 Python
在Python 2.7即将停止支持时,我们为你带来了一份python 3.x迁移指南
2018/01/30 Python
python 通过麦克风录音 生成wav文件的方法
2019/01/09 Python
在python中实现强制关闭线程的示例
2019/01/22 Python
PyQt4实时显示文本内容GUI的示例
2019/06/14 Python
tensorflow的计算图总结
2020/01/12 Python
python目标检测给图画框,bbox画到图上并保存案例
2020/03/10 Python
Python使用正则表达式实现爬虫数据抽取
2020/08/17 Python
新加坡领先的时尚生活方式零售品牌:CHARLES & KEITH
2018/01/16 全球购物
Hotels.com韩国:海外国内旅行所需的酒店和住宿预订网站
2020/05/08 全球购物
财务经理的岗位职责
2013/12/17 职场文书
你的创业计划书怎样才能打动风投
2014/02/06 职场文书
介绍信怎么写
2015/05/05 职场文书
python实现socket简单通信的示例代码
2021/04/13 Python
python使用openpyxl库读写Excel表格的方法(增删改查操作)
2021/05/02 Python
关于Oracle12C默认用户名system密码不正确的解决方案
2021/10/16 Oracle