python爬虫简单的添加代理进行访问的实现代码


Posted in Python onApril 04, 2019

在使用python对网页进行多次快速爬取的时候,访问次数过于频繁,服务器不会考虑User-Agent的信息,会直接把你视为爬虫,从而过滤掉,拒绝你的访问,在这种时候就需要设置代理,我们可以给proxies属性设置一个代理的IP地址,代码如下:

import requests
 from lxml import etree
 url = "https://www.ip.cn"
 headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36 OPR/57.0.3098.116", }
 pro = {
 # 'https': 'https://118.122.92.252:37901', #四川省成都市 电信
 'https': 'https://27.17.45.90:43411', #湖北省武汉市 电信
 }
 try:
 response = requests.get(url, headers=headers, proxies=pro)
 html_str = response.content.decode()
 # print(html_str)
 html = etree.HTML(html_str)
 message = html.xpath("//div[@class='well']//p/text()")
 ip = html.xpath("//div[@class='well']//p/code/text()")
 eng = html.xpath("//div[@class='well']/p/text()")
 print(message[0]+ip[0])
 print(message[1]+ip[1])
 print(eng[2])
 except requests.exceptions.ProxyError as e:
 print("当前代理异常")
 except:
 print("当前请求异常")

在上面的代码中,调用requests库,对一个IP地址查询网页进行访问,随后使用lxml库的xpath对网页进行分析提取,返回用户访问此网页时自己的IP地址,如果代理设置成功,则会返回你的信息和IP地址,如下:

python爬虫简单的添加代理进行访问的实现代码

如果代理失败则会返回异常,在代码中使用了捕获异常,则会返回设置的提示信息,"当前代理异常",如果不是代理的错误则是"当前请求异常"

python爬虫简单的添加代理进行访问的实现代码

PS:免费的代理不是很稳定,在确认代码无误后,如果仍然返回异常,可尝试更换代理IP...

总结

以上所述是小编给大家介绍的python爬虫简单的添加代理进行访问的实现代码,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python常用正则表达式符号浅析
Aug 13 Python
Python读取环境变量的方法和自定义类分享
Nov 22 Python
Python实现简单的多任务mysql转xml的方法
Feb 08 Python
python使用turtle库绘制时钟
Mar 25 Python
Python实现的对一个数进行因式分解操作示例
Jun 27 Python
python将字符串转换成json的方法小结
Jul 09 Python
PyCharm汉化安装及永久激活详细教程(靠谱)
Jan 16 Python
Pytorch 使用opnecv读入图像由HWC转为BCHW格式方式
Jun 02 Python
Django 实现 Websocket 广播、点对点发送消息的代码
Jun 03 Python
Jupyter Notebook 安装配置与使用详解
Jan 06 Python
Python基础之元组与文件知识总结
May 19 Python
python 镜像环境搭建总结
Sep 23 Python
Django项目中添加ldap登陆认证功能的实现
Apr 04 #Python
使用 Python 玩转 GitHub 的贡献板(推荐)
Apr 04 #Python
python中yield的用法详解——最简单,最清晰的解释
Apr 04 #Python
详解python项目实战:模拟登陆CSDN
Apr 04 #Python
Python实现字符串匹配的KMP算法
Apr 04 #Python
Python GUI编程完整示例
Apr 04 #Python
Python使用sax模块解析XML文件示例
Apr 04 #Python
You might like
基于php-fpm的配置详解
2013/06/03 PHP
Linux Apache PHP Oracle 安装配置(具体操作步骤)
2013/06/17 PHP
教你如何开启shopnc b2b2c 伪静态
2014/10/21 PHP
php在线解压ZIP文件的方法
2014/12/30 PHP
WHOOPS PHP调试库的使用
2017/09/29 PHP
laravel框架如何设置公共头和公共尾
2019/10/22 PHP
IE和Firefox的Javascript兼容性总结[推荐收藏]
2011/10/19 Javascript
js操纵dom生成下拉列表框的方法
2014/02/24 Javascript
jquery查找父元素、子元素(个人经验总结)
2014/04/09 Javascript
js实现拖拽效果
2015/02/12 Javascript
JQuery+CSS实现图片上放置按钮的方法
2015/05/29 Javascript
JavaScript实现跑马灯抽奖活动实例代码解析与优化(一)
2016/02/16 Javascript
ionic组件ion-tabs选项卡切换效果实例
2016/08/27 Javascript
js本地图片预览实现代码
2016/10/09 Javascript
快速掌握jQuery插件WebUploader文件上传
2016/11/07 Javascript
js实现下拉菜单效果
2017/03/01 Javascript
关于预加载InstantClick的问题解决方法
2017/09/12 Javascript
浅谈vue 单文件探索
2018/09/05 Javascript
使用wxapp-img-loader自定义组件实现微信小程序图片预加载功能
2018/10/18 Javascript
jQuery模仿ToDoList实现简单的待办事项列表
2019/12/30 jQuery
nginx部署多个vue项目的方法示例
2020/09/06 Javascript
python单例模式实例分析
2015/04/08 Python
使用相同的Apache实例来运行Django和Media文件
2015/07/22 Python
python分析作业提交情况
2017/11/22 Python
Python实现基于SVM的分类器的方法
2019/07/19 Python
Transpose 数组行列转置的限制方式
2020/02/11 Python
Python OpenCV读取显示视频的方法示例
2020/02/20 Python
HTML5 视频播放(video),JavaScript控制视频的实例代码
2018/10/08 HTML / CSS
Dr. Martens马汀博士官网:马丁靴始祖品牌
2016/10/15 全球购物
欧洲最古老的鞋厂:Peter Kaiser
2019/11/05 全球购物
环境科学专业研究生求职信
2013/10/02 职场文书
优秀的毕业生的自我评价
2013/12/12 职场文书
市级三好学生事迹材料
2014/08/27 职场文书
导游词欢迎词
2015/02/02 职场文书
职位证明模板
2015/06/23 职场文书
《悲惨世界》:比天空更广阔的是人的心灵
2020/01/16 职场文书