编程 Python

python爬虫简单的添加代理进行访问的实现代码

Posted in Python onApril 04, 2019

在使用python对网页进行多次快速爬取的时候,访问次数过于频繁,服务器不会考虑User-Agent的信息,会直接把你视为爬虫,从而过滤掉,拒绝你的访问,在这种时候就需要设置代理,我们可以给proxies属性设置一个代理的IP地址,代码如下:

import requests
 from lxml import etree
 url = "https://www.ip.cn"
 headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36 OPR/57.0.3098.116", }
 pro = {
 # 'https': 'https://118.122.92.252:37901', #四川省成都市 电信
 'https': 'https://27.17.45.90:43411', #湖北省武汉市 电信
 }
 try:
 response = requests.get(url, headers=headers, proxies=pro)
 html_str = response.content.decode()
 # print(html_str)
 html = etree.HTML(html_str)
 message = html.xpath("//div[@class='well']//p/text()")
 ip = html.xpath("//div[@class='well']//p/code/text()")
 eng = html.xpath("//div[@class='well']/p/text()")
 print(message[0]+ip[0])
 print(message[1]+ip[1])
 print(eng[2])
 except requests.exceptions.ProxyError as e:
 print("当前代理异常")
 except:
 print("当前请求异常")

在上面的代码中,调用requests库,对一个IP地址查询网页进行访问,随后使用lxml库的xpath对网页进行分析提取,返回用户访问此网页时自己的IP地址,如果代理设置成功,则会返回你的信息和IP地址,如下:

如果代理失败则会返回异常,在代码中使用了捕获异常,则会返回设置的提示信息,"当前代理异常",如果不是代理的错误则是"当前请求异常"

python爬虫简单的添加代理进行访问的实现代码

PS:免费的代理不是很稳定,在确认代码无误后,如果仍然返回异常,可尝试更换代理IP...

总结

以上所述是小编给大家介绍的python爬虫简单的添加代理进行访问的实现代码，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持！

python爬虫简单的添加代理进行访问的实现代码

- Author -

学好Python吧

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python常用正则表达式符号浅析

Aug 13 Python

Python读取环境变量的方法和自定义类分享

Nov 22 Python

Python实现简单的多任务mysql转xml的方法

Feb 08 Python

python使用turtle库绘制时钟

Mar 25 Python

Python实现的对一个数进行因式分解操作示例

Jun 27 Python

python将字符串转换成json的方法小结

Jul 09 Python

PyCharm汉化安装及永久激活详细教程(靠谱)

Jan 16 Python

Pytorch 使用opnecv读入图像由HWC转为BCHW格式方式

Jun 02 Python

Django 实现 Websocket 广播、点对点发送消息的代码

Jun 03 Python

Jupyter Notebook 安装配置与使用详解

Jan 06 Python

Python基础之元组与文件知识总结

May 19 Python

python 镜像环境搭建总结

Sep 23 Python

Django项目中添加ldap登陆认证功能的实现

Apr 04 #Python

使用 Python 玩转 GitHub 的贡献板(推荐)

Apr 04 #Python

python中yield的用法详解——最简单，最清晰的解释

Apr 04 #Python

详解python项目实战:模拟登陆CSDN

Apr 04 #Python

Python实现字符串匹配的KMP算法

Apr 04 #Python

Python GUI编程完整示例

Apr 04 #Python

Python使用sax模块解析XML文件示例

Apr 04 #Python

You might like

基于php-fpm的配置详解

2013/06/03 PHP

Linux Apache PHP Oracle 安装配置(具体操作步骤)

2013/06/17 PHP

教你如何开启shopnc b2b2c 伪静态

2014/10/21 PHP

php在线解压ZIP文件的方法

2014/12/30 PHP

WHOOPS PHP调试库的使用

2017/09/29 PHP

laravel框架如何设置公共头和公共尾

2019/10/22 PHP

IE和Firefox的Javascript兼容性总结[推荐收藏]

2011/10/19 Javascript

js操纵dom生成下拉列表框的方法

2014/02/24 Javascript

jquery查找父元素、子元素(个人经验总结)

2014/04/09 Javascript

js实现拖拽效果

2015/02/12 Javascript

JQuery+CSS实现图片上放置按钮的方法

2015/05/29 Javascript

JavaScript实现跑马灯抽奖活动实例代码解析与优化（一）

2016/02/16 Javascript

ionic组件ion-tabs选项卡切换效果实例

2016/08/27 Javascript

js本地图片预览实现代码

2016/10/09 Javascript

快速掌握jQuery插件WebUploader文件上传

2016/11/07 Javascript

js实现下拉菜单效果

2017/03/01 Javascript

关于预加载InstantClick的问题解决方法

2017/09/12 Javascript

浅谈vue 单文件探索

2018/09/05 Javascript

使用wxapp-img-loader自定义组件实现微信小程序图片预加载功能

2018/10/18 Javascript

jQuery模仿ToDoList实现简单的待办事项列表

2019/12/30 jQuery

nginx部署多个vue项目的方法示例

2020/09/06 Javascript

python单例模式实例分析

2015/04/08 Python

使用相同的Apache实例来运行Django和Media文件

2015/07/22 Python

python分析作业提交情况

2017/11/22 Python

Python实现基于SVM的分类器的方法

2019/07/19 Python

Transpose 数组行列转置的限制方式

2020/02/11 Python

Python OpenCV读取显示视频的方法示例

2020/02/20 Python

HTML5 视频播放(video),JavaScript控制视频的实例代码

2018/10/08 HTML / CSS

Dr. Martens马汀博士官网：马丁靴始祖品牌

2016/10/15 全球购物

欧洲最古老的鞋厂：Peter Kaiser

2019/11/05 全球购物

环境科学专业研究生求职信

2013/10/02 职场文书

优秀的毕业生的自我评价

2013/12/12 职场文书

市级三好学生事迹材料

2014/08/27 职场文书

导游词欢迎词

2015/02/02 职场文书

职位证明模板

2015/06/23 职场文书

《悲惨世界》：比天空更广阔的是人的心灵

2020/01/16 职场文书