python爬虫简单的添加代理进行访问的实现代码


Posted in Python onApril 04, 2019

在使用python对网页进行多次快速爬取的时候,访问次数过于频繁,服务器不会考虑User-Agent的信息,会直接把你视为爬虫,从而过滤掉,拒绝你的访问,在这种时候就需要设置代理,我们可以给proxies属性设置一个代理的IP地址,代码如下:

import requests
 from lxml import etree
 url = "https://www.ip.cn"
 headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36 OPR/57.0.3098.116", }
 pro = {
 # 'https': 'https://118.122.92.252:37901', #四川省成都市 电信
 'https': 'https://27.17.45.90:43411', #湖北省武汉市 电信
 }
 try:
 response = requests.get(url, headers=headers, proxies=pro)
 html_str = response.content.decode()
 # print(html_str)
 html = etree.HTML(html_str)
 message = html.xpath("//div[@class='well']//p/text()")
 ip = html.xpath("//div[@class='well']//p/code/text()")
 eng = html.xpath("//div[@class='well']/p/text()")
 print(message[0]+ip[0])
 print(message[1]+ip[1])
 print(eng[2])
 except requests.exceptions.ProxyError as e:
 print("当前代理异常")
 except:
 print("当前请求异常")

在上面的代码中,调用requests库,对一个IP地址查询网页进行访问,随后使用lxml库的xpath对网页进行分析提取,返回用户访问此网页时自己的IP地址,如果代理设置成功,则会返回你的信息和IP地址,如下:

python爬虫简单的添加代理进行访问的实现代码

如果代理失败则会返回异常,在代码中使用了捕获异常,则会返回设置的提示信息,"当前代理异常",如果不是代理的错误则是"当前请求异常"

python爬虫简单的添加代理进行访问的实现代码

PS:免费的代理不是很稳定,在确认代码无误后,如果仍然返回异常,可尝试更换代理IP...

总结

以上所述是小编给大家介绍的python爬虫简单的添加代理进行访问的实现代码,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python的Bottle框架中返回静态文件和JSON对象的方法
Apr 30 Python
深入解析Python编程中JSON模块的使用
Oct 15 Python
简单实现python收发邮件功能
Jan 05 Python
django框架面向对象ORM模型继承用法实例分析
Jul 29 Python
PyQtGraph在pyqt中的应用及安装过程
Aug 04 Python
如何用Python来理一理红楼梦里的那些关系
Aug 14 Python
通过celery异步处理一个查询任务的完整代码
Nov 19 Python
Pytorch 实现计算分类器准确率(总分类及子分类)
Jan 18 Python
Python实现结构体代码实例
Feb 10 Python
python+selenium 脚本实现每天自动登记的思路详解
Mar 11 Python
matlab 计算灰度图像的一阶矩,二阶矩,三阶矩实例
Apr 22 Python
python字符串的一些常见实用操作
Apr 06 Python
Django项目中添加ldap登陆认证功能的实现
Apr 04 #Python
使用 Python 玩转 GitHub 的贡献板(推荐)
Apr 04 #Python
python中yield的用法详解——最简单,最清晰的解释
Apr 04 #Python
详解python项目实战:模拟登陆CSDN
Apr 04 #Python
Python实现字符串匹配的KMP算法
Apr 04 #Python
Python GUI编程完整示例
Apr 04 #Python
Python使用sax模块解析XML文件示例
Apr 04 #Python
You might like
木翼下载系统中说明的PHP安全配置方法
2007/06/16 PHP
PHP中调用ASP.NET的WebService的代码
2011/04/22 PHP
PHP实现时间轴函数代码
2011/10/08 PHP
php实现SAE上使用storage上传与下载文件的方法
2015/06/29 PHP
PHP代码实现表单数据验证类
2015/07/28 PHP
WordPress中用于检索模版的相关PHP函数使用解析
2015/12/15 PHP
javascript与Python快速排序实例对比
2015/08/10 Javascript
Javascript函数式编程语言
2015/10/11 Javascript
js时间戳转为日期格式的方法
2015/12/28 Javascript
ES6新特性之变量和字符串用法示例
2017/04/01 Javascript
Angular4学习笔记之新建项目的方法
2017/07/18 Javascript
Js通过AES加密后PHP用Openssl解密的方法
2019/07/12 Javascript
[49:31]TFT vs Mski Supermajor小组赛C组 BO3 第一场 6.3
2018/06/04 DOTA
python2.7删除文件夹和删除文件代码实例
2013/12/18 Python
python构造icmp echo请求和实现网络探测器功能代码分享
2014/01/10 Python
Python下使用Psyco模块优化运行速度
2015/04/05 Python
利用python实现微信头像加红色数字功能
2018/03/26 Python
python opencv调用笔记本摄像头
2019/08/28 Python
python实现简单成绩录入系统
2019/09/19 Python
Python如何将图像音视频等资源文件隐藏在代码中(小技巧)
2020/02/16 Python
使用Python将图片转正方形的两种方法实例代码详解
2020/04/29 Python
Python实现读取并写入Excel文件过程解析
2020/05/27 Python
如何解决安装python3.6.1失败
2020/07/01 Python
CSS3 3D位移translate效果实例介绍
2016/05/03 HTML / CSS
铁路个人事迹材料
2014/01/30 职场文书
《老王》教学反思
2014/02/23 职场文书
技校毕业生自荐书
2014/05/23 职场文书
奉献家乡演讲稿
2014/09/13 职场文书
咖啡店创业计划书范文
2014/09/15 职场文书
2014年督导工作总结
2014/11/19 职场文书
中学教师个人总结
2015/02/10 职场文书
学习新党章心得体会2016
2016/01/15 职场文书
3招让你摆脱即兴讲话冷场尴尬
2019/08/08 职场文书
Python pygame实现中国象棋单机版源码
2021/06/20 Python
Python学习之迭代器详解
2022/04/01 Python
分析SQL窗口函数之排名窗口函数
2022/04/21 Oracle