python爬虫简单的添加代理进行访问的实现代码


Posted in Python onApril 04, 2019

在使用python对网页进行多次快速爬取的时候,访问次数过于频繁,服务器不会考虑User-Agent的信息,会直接把你视为爬虫,从而过滤掉,拒绝你的访问,在这种时候就需要设置代理,我们可以给proxies属性设置一个代理的IP地址,代码如下:

import requests
 from lxml import etree
 url = "https://www.ip.cn"
 headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36 OPR/57.0.3098.116", }
 pro = {
 # 'https': 'https://118.122.92.252:37901', #四川省成都市 电信
 'https': 'https://27.17.45.90:43411', #湖北省武汉市 电信
 }
 try:
 response = requests.get(url, headers=headers, proxies=pro)
 html_str = response.content.decode()
 # print(html_str)
 html = etree.HTML(html_str)
 message = html.xpath("//div[@class='well']//p/text()")
 ip = html.xpath("//div[@class='well']//p/code/text()")
 eng = html.xpath("//div[@class='well']/p/text()")
 print(message[0]+ip[0])
 print(message[1]+ip[1])
 print(eng[2])
 except requests.exceptions.ProxyError as e:
 print("当前代理异常")
 except:
 print("当前请求异常")

在上面的代码中,调用requests库,对一个IP地址查询网页进行访问,随后使用lxml库的xpath对网页进行分析提取,返回用户访问此网页时自己的IP地址,如果代理设置成功,则会返回你的信息和IP地址,如下:

python爬虫简单的添加代理进行访问的实现代码

如果代理失败则会返回异常,在代码中使用了捕获异常,则会返回设置的提示信息,"当前代理异常",如果不是代理的错误则是"当前请求异常"

python爬虫简单的添加代理进行访问的实现代码

PS:免费的代理不是很稳定,在确认代码无误后,如果仍然返回异常,可尝试更换代理IP...

总结

以上所述是小编给大家介绍的python爬虫简单的添加代理进行访问的实现代码,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
使用Python对IP进行转换的一些操作技巧小结
Nov 09 Python
Python基础教程之正则表达式基本语法以及re模块
Mar 25 Python
python re模块findall()函数实例解析
Jan 19 Python
详解Python如何生成词云的方法
Jun 01 Python
Python实现快速计算词频功能示例
Jun 25 Python
Django中提供的6种缓存方式详解
Aug 05 Python
Python人工智能之路 jieba gensim 最好别分家之最简单的相似度实现
Aug 13 Python
Python网络编程之使用TCP方式传输文件操作示例
Nov 01 Python
python创建子类的方法分析
Nov 28 Python
python pip安装包出现:Failed building wheel for xxx错误的解决
Dec 25 Python
Python for循环搭配else常见问题解决
Feb 11 Python
基于python爬取有道翻译过程图解
Mar 31 Python
Django项目中添加ldap登陆认证功能的实现
Apr 04 #Python
使用 Python 玩转 GitHub 的贡献板(推荐)
Apr 04 #Python
python中yield的用法详解——最简单,最清晰的解释
Apr 04 #Python
详解python项目实战:模拟登陆CSDN
Apr 04 #Python
Python实现字符串匹配的KMP算法
Apr 04 #Python
Python GUI编程完整示例
Apr 04 #Python
Python使用sax模块解析XML文件示例
Apr 04 #Python
You might like
用PHP书写安全的脚本代码
2012/02/05 PHP
php递归实现无限分类的方法
2015/07/28 PHP
PHP中phar包的使用教程
2017/06/14 PHP
thinkPHP5实现数据库添加内容的方法
2017/10/25 PHP
捕获关闭窗口的脚本
2009/01/10 Javascript
通过JS来动态的修改url,实现对url的增删查改
2014/09/01 Javascript
javascript正则表达式使用replace()替换手机号的方法
2015/01/19 Javascript
js实现iframe自动自适应高度的方法
2015/02/17 Javascript
JavaScript实现弹出DIV层同时页面背景渐变成半透明效果
2016/03/25 Javascript
DOM操作和jQuery实现选项移动操作的简单实例
2016/06/07 Javascript
Vue自定义指令拖拽功能示例
2017/02/17 Javascript
微信小程序开发中的疑问解答汇总
2017/07/03 Javascript
D3.js实现简洁实用的动态仪表盘的示例
2018/04/04 Javascript
vue+mousemove实现鼠标拖动功能(拖动过快失效问题解决方法)
2018/08/24 Javascript
jquery实现异步文件上传ajaxfileupload.js
2020/10/23 jQuery
JavaScript实现页面高亮操作提示和蒙板
2021/01/04 Javascript
JS实现点击掉落特效
2021/01/29 Javascript
Python的Tornado框架实现异步非阻塞访问数据库的示例
2016/06/30 Python
Fabric 应用案例
2016/08/28 Python
Python数据结构之翻转链表
2017/02/25 Python
python调用百度语音识别实现大音频文件语音识别功能
2018/08/30 Python
python爬取微信公众号文章
2018/08/31 Python
Python实现注册、登录小程序功能
2018/09/21 Python
在Python中实现shuffle给列表洗牌
2018/11/08 Python
Python3利用Dlib实现摄像头实时人脸检测和平铺显示示例
2019/02/21 Python
Python多进程fork()函数详解
2019/02/22 Python
Python 使用 environs 库定义环境变量的方法
2020/02/25 Python
TensorFlow-gpu和opencv安装详细教程
2020/06/30 Python
一款纯css3实现的鼠标悬停动画按钮
2014/12/29 HTML / CSS
以实惠的价格提供高品质的时尚:Newchic
2018/01/18 全球购物
日本必酷网络直营店:Biccamera
2019/03/23 全球购物
护士节策划方案
2014/05/19 职场文书
护士实习求职信
2014/06/22 职场文书
感谢信格式范文
2015/01/22 职场文书
美术教师求职信范文
2015/03/20 职场文书
MySQL约束(创建表时的各种条件说明)
2022/06/21 MySQL