对python使用http、https代理的实例讲解


Posted in Python onMay 07, 2018

在国内利用Python从Internet上爬取数据时,有些网站或API接口被限速或屏蔽,这时使用代理可以加速爬取过程,减少请求失败,Python程序使用代理的方法主要有以下几种:

(1)如果是在代码中使用一些网络库或爬虫框架进行数据爬取,一般这种框架都会支持设置代理,例如:

<span style="font-size:14px;">import urllib.request as urlreq 
# 设置https代理 
ph = urlreq.ProxyHandler({'https': 'https://127.0.0.1:1080'}) 
oper = urlreq.build_opener(ph) 
# 将代理安装到全局环境,这样所有请求都会自动使用代理 
urlreq.install_opener(oper) 
res = oper.open("https://www.google.com") 
print(res.read())</span>
<span style="font-size:14px;">import requests as req 
print(req.get("https://www.google.com", proxies={'https': 'https://127.0.0.1:1080'}).content)</span>

(2)如果使用的库没有提供设置代理的接口,但是底层使用了urllib、requests等库,可以尝试设置HTTP_PROXY 和HTTPS_PROXY环境变量,常用的网络库会自动识别这些环境变量,使用变量设置的代理发起请求,设置如下:

import os 
os.environ['http_proxy'] = 'http://127.0.0.1:1080' 
os.environ['https_proxy'] = 'https://127.0.0.1:1080'

(3)如果上述两种方法都没有用,那么还可以使用一些可以监听、拦截和修改网络包的工具和库如(Fiddler、mitmproxy)来拦截http请求包并修改地址,达到使用代理的效果。

以上这篇对python使用http、https代理的实例讲解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python逐行读取文件内容的三种方法
Jan 20 Python
Python datetime时间格式化去掉前导0
Jul 31 Python
Windows下使Python2.x版本的解释器与3.x共存的方法
Oct 25 Python
Python模拟用户登录验证
Sep 11 Python
python实现二分查找算法
Sep 21 Python
python3+mysql查询数据并通过邮件群发excel附件
Feb 24 Python
Python缓存技术实现过程详解
Sep 25 Python
Python assert关键字原理及实例解析
Dec 13 Python
pytorch实现用CNN和LSTM对文本进行分类方式
Jan 08 Python
python利用递归方法实现求集合的幂集
Sep 07 Python
Python中字符串对象语法分享
Feb 24 Python
解决IDEA翻译插件Translation报错更新TTK失败不能使用
Apr 24 Python
python3 requests中使用ip代理池随机生成ip的实例
May 07 #Python
python使用代理ip访问网站的实例
May 07 #Python
一些Centos Python 生产环境的部署命令(推荐)
May 07 #Python
Python实现爬虫设置代理IP和伪装成浏览器的方法分享
May 07 #Python
Pyspider中给爬虫伪造随机请求头的实例
May 07 #Python
python通过伪装头部数据抵抗反爬虫的实例
May 07 #Python
Django Web开发中django-debug-toolbar的配置以及使用
May 06 #Python
You might like
PHPMailer 中文使用说明小结
2010/01/22 PHP
跟我学Laravel之路由
2014/10/15 PHP
ThinkPHP3.2.3数据库设置新特性
2015/03/05 PHP
PHP+iframe图片上传实现即时刷新效果
2016/11/18 PHP
学习js所必须要知道的一些
2007/03/07 Javascript
js querySelector和getElementById通过id获取元素的区别
2012/04/20 Javascript
javascript校验价格合法性实例(必须输入2位小数)
2014/05/05 Javascript
IE6中链接A的href为javascript协议时不在当前页面跳转
2014/06/05 Javascript
微信小程序侧边栏滑动特效(左右滑动)
2017/01/23 Javascript
Javascript实现页面滚动时导航智能定位
2017/05/06 Javascript
JavaScript脚本语言是什么_动力节点Java学院整理
2017/06/26 Javascript
JS 实现banner图片轮播效果(鼠标事件)
2017/08/04 Javascript
微信小程序 页面滑动事件的实例详解
2017/10/12 Javascript
vue之父子组件间通信实例讲解(props、$ref、$emit)
2018/05/22 Javascript
Webpack的dll功能使用
2018/06/28 Javascript
vue axios封装及API统一管理的方法
2019/04/18 Javascript
详解Vue源码中一些util函数
2019/04/24 Javascript
nodejs对项目下所有空文件夹创建gitkeep的方法
2019/08/02 NodeJs
Python实现国外赌场热门游戏Craps(双骰子)
2015/03/31 Python
对于Python异常处理慎用“except:pass”建议
2015/04/02 Python
浅谈Tensorflow模型的保存与恢复加载
2018/04/26 Python
python 拷贝特定后缀名文件,并保留原始目录结构的实例
2018/04/27 Python
推荐10款最受Python开发者欢迎的Python IDE
2018/09/16 Python
python中的函数递归和迭代原理解析
2019/11/14 Python
Django 限制访问频率的思路详解
2019/12/24 Python
使用html5+css3来实现slider切换效果告别javascript+css
2013/01/08 HTML / CSS
在canvas上实现元素图片镜像翻转动画效果的方法
2018/03/20 HTML / CSS
官方授权图形T恤和服装:Fifth Sun
2019/06/12 全球购物
解释i节点在文件系统中的作用
2013/11/26 面试题
演讲比赛获奖感言
2014/02/02 职场文书
创新社会管理心得体会
2014/09/12 职场文书
2014年仓库保管员工作总结
2014/12/03 职场文书
2014年数学教研组工作总结
2014/12/06 职场文书
2016猴年春节慰问信
2015/11/30 职场文书
2016年学习雷锋精神广播稿
2015/12/17 职场文书
用Python selenium实现淘宝抢单机器人
2021/06/18 Python