对python使用http、https代理的实例讲解


Posted in Python onMay 07, 2018

在国内利用Python从Internet上爬取数据时,有些网站或API接口被限速或屏蔽,这时使用代理可以加速爬取过程,减少请求失败,Python程序使用代理的方法主要有以下几种:

(1)如果是在代码中使用一些网络库或爬虫框架进行数据爬取,一般这种框架都会支持设置代理,例如:

<span style="font-size:14px;">import urllib.request as urlreq 
# 设置https代理 
ph = urlreq.ProxyHandler({'https': 'https://127.0.0.1:1080'}) 
oper = urlreq.build_opener(ph) 
# 将代理安装到全局环境,这样所有请求都会自动使用代理 
urlreq.install_opener(oper) 
res = oper.open("https://www.google.com") 
print(res.read())</span>
<span style="font-size:14px;">import requests as req 
print(req.get("https://www.google.com", proxies={'https': 'https://127.0.0.1:1080'}).content)</span>

(2)如果使用的库没有提供设置代理的接口,但是底层使用了urllib、requests等库,可以尝试设置HTTP_PROXY 和HTTPS_PROXY环境变量,常用的网络库会自动识别这些环境变量,使用变量设置的代理发起请求,设置如下:

import os 
os.environ['http_proxy'] = 'http://127.0.0.1:1080' 
os.environ['https_proxy'] = 'https://127.0.0.1:1080'

(3)如果上述两种方法都没有用,那么还可以使用一些可以监听、拦截和修改网络包的工具和库如(Fiddler、mitmproxy)来拦截http请求包并修改地址,达到使用代理的效果。

以上这篇对python使用http、https代理的实例讲解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python爬虫框架Scrapy安装使用步骤
Apr 01 Python
Python中将dataframe转换为字典的实例
Apr 13 Python
在win10和linux上分别安装Python虚拟环境的方法步骤
May 09 Python
Django REST framework 分页的实现代码
Jun 19 Python
Django中celery执行任务结果的保存方法
Jul 12 Python
Python 迭代,for...in遍历,迭代原理与应用示例
Oct 12 Python
Django使用消息提示简单的弹出个对话框实例
Nov 15 Python
python字典的值可以修改吗
Jun 29 Python
scrapy结合selenium解析动态页面的实现
Sep 28 Python
给numpy.array增加维度的超简单方法
Jun 02 Python
python for循环赋值问题
Jun 03 Python
一些让Python代码简洁的实用技巧总结
Aug 23 Python
python3 requests中使用ip代理池随机生成ip的实例
May 07 #Python
python使用代理ip访问网站的实例
May 07 #Python
一些Centos Python 生产环境的部署命令(推荐)
May 07 #Python
Python实现爬虫设置代理IP和伪装成浏览器的方法分享
May 07 #Python
Pyspider中给爬虫伪造随机请求头的实例
May 07 #Python
python通过伪装头部数据抵抗反爬虫的实例
May 07 #Python
Django Web开发中django-debug-toolbar的配置以及使用
May 06 #Python
You might like
php 生成WML页面方法详解
2009/08/09 PHP
php 数组使用详解 推荐
2011/06/02 PHP
PHP中Notice错误常见解决方法
2017/04/28 PHP
JavaScript使用cookie
2007/02/02 Javascript
跨域表单提交状态的变相判断代码
2009/11/12 Javascript
IE8对JS通过属性和数组遍历解析不一样的地方探讨
2013/05/06 Javascript
js调用后台、后台调用前台等方法总结
2014/04/17 Javascript
jQuery中extend函数的实现原理详解
2015/02/03 Javascript
jQuery实现的漂亮表单效果代码
2015/08/18 Javascript
原生js仿jquery animate动画效果
2016/07/13 Javascript
深入浅出讲解ES6的解构
2016/08/03 Javascript
JS正则表达式验证账号、手机号、电话和邮箱是否合法
2017/03/08 Javascript
Nginx 配置多站点vhost 的方法
2018/01/07 Javascript
Nuxt.js开启SSR渲染的教程详解
2018/11/30 Javascript
Android 自定义view仿微信相机单击拍照长按录视频按钮
2019/07/19 Javascript
webpack常用配置总览(小结)
2019/11/18 Javascript
JS typeof fn === 'function' &amp;&amp; fn()详解
2020/08/22 Javascript
基于Vue2实现移动端图片上传、压缩、拖拽排序、拖拽删除功能
2021/01/05 Vue.js
python unittest实现api自动化测试
2018/04/04 Python
Python数据可视化:顶级绘图库plotly详解
2019/12/07 Python
Python使用requests xpath 并开启多线程爬取西刺代理ip实例
2020/03/06 Python
澳大利亚工具仓库:Tools Warehouse
2018/10/15 全球购物
Joseph官网:英国小众奢侈品牌
2019/05/17 全球购物
运动会100米解说词
2014/01/23 职场文书
自主招生自荐信指南
2014/02/04 职场文书
2014年乡镇植树节活动方案
2014/02/28 职场文书
促销活动总结
2014/04/28 职场文书
技术股东合作协议书
2014/12/02 职场文书
勤俭节约倡议书范文
2015/04/29 职场文书
雷锋的故事观后感
2015/06/10 职场文书
家庭教育教师培训学习体会
2016/01/14 职场文书
小学四年级作文之人物作文
2019/11/06 职场文书
HTML5中 rem适配方案与 viewport 适配问题详解
2021/04/27 HTML / CSS
MySQL 逻辑备份与恢复测试的相关总结
2021/05/14 MySQL
Java 垃圾回收超详细讲解记忆集和卡表
2022/04/08 Java/Android
Python自动操作神器PyAutoGUI的使用教程
2022/06/16 Python