python requests模块的使用示例


Posted in Python onApril 07, 2021

为什么使用requests:

  • 支持使用Cookie保持会话
  • 支持文件上传
  • 支持自动确定响应内容的编码
  • 对用户来说比较人性化

模拟get请求:

获取token

# 使用微信公众平台举例
get_param_dict={
 "grant_type":"**************",
 "appid":"**************",
 "secret":"**************",
}
response = requests.get(url='https://api.weixin.qq.com/cgi-bin/token', # url地址
      params=get_param_dict) # 参数
print(response.content.decode('utf-8'))

模拟请求头部信息

注:因为requests请求头是以python,requests发起的,所以大部分接口都会需要手动添加头部信息

# get 模拟请求头部信息,(当你发现数据不对时,就模拟)
# 以百度举例
get_param_dict ={
 "wd":"newdream"
}
# 添加头部信息字典(可以使用抓包抓取到头部信息)
header_info_dict = {
 "User-Agent":"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36",
 "Accpet":"text/plain, */*; q=0.01"
}
response = requests.get(url = 'https://www.baidu.com/s',
      params=get_param_dict,headers=header_info_dict)
print(response.content.decode('utf-8'))

模拟post请求

import requests,json
# requests模拟发送post请求
# 使用微信公众平台举例
url_param_doct = {"access_token": "43_XcK_1rvR8VPgicGGzq7Vp2QrGx30Kwhy9SSShoVTQs11G_jP9aqhy2bwRQFuG2hYzkwVjphJFfPj8WYQR8vgfu5Xej7KaZBiyPDJ9sYoCKte78sqgtBdCf6N5S8QosNXBOFSEJnzLMbxJwCOTWAgAAANQU"}
post_param_data = {
 "tag" : {  "name" : "我是新标签" }
}
response = requests.post(url='https://api.weixin.qq.com/cgi-bin/tags/create',
       params=url_param_doct,
       # json=post_param_data # 可以使用json
       data=json.dumps(post_param_data) # 也可以使用data,但是data要求是字符串,需要使用json模块dumps转化
       )
print(response.content.decode('utf-8'))

requests上传文件

import requests,os
# post上传文件
current_path = os.path.dirname(__file__) # os模块定位当前路径
excel_path = os.path.join(current_path,'..','data','j.xlsx') # join拼接
excel_file = {'file':open(excel_path,'rb')} # 做成字典,open打开文件 rb:只读二进制
response = requests.post(url='https://2.python-requests.org/', # requests官方实例文档地址
       files=excel_file) # files传文件
print( response.content.decode('utf-8') )

requests设置代理

import requests
# 设置代理:为什么设置代理?
# 爬虫类项目,有检测机制
# 防止公司系统有防灌水功能
# 需要翻墙做接口的时候
proxy_server = {'http':'http://127.0.0.1:8888',
    'https':'http://127.0.0.1:8888'} # 做一个字典
proxy_user_pass = {
 'https':'http://uesrname:password@127.0.0.1:8888' # 需要用户跟密码使用这个
}
response = requests.get(url= 'https://baidu.com',
      proxies=proxy_server) # proxies设置代理关键字
print(response.status_code)

time模块设置请求超时

如果一个请求很久没有结果,就会让整个项目的效率变得非常低,这个时候我们就需要对请求进行强制要求

让他必须在特定的时间内返回结果,否则就报错。

# 设置请求超时
import requests
import time
print(time.time()) # 时间戳
response = requests.get(url='https://www.baidu.com',timeout=3) # timeout=3: 请求如果在规定时间之内(3秒钟内)没有得到响应,就会抛出超时错误
print(time.time())

retrying模块设置刷新

使用超时参数能够加快我们整体的请求速度,但是在正常的网页浏览过成功,如果发生速度很慢的情况,我们会做的选择是刷新页面

retrying模块就可以帮助我们解决。使用retrying模块提供的retry模块

通过装饰器的方式使用,让被装饰的函数反复执行retry中可以传入参数stop_max_attempt_number,让函数报错后继续重新执行

达到最大执行次数的上限,如果每次都报错,整个函数报错,如果中间有一个成功,程序继续往后执行。

import requests
from retrying import retry


# 如果函数连续调用三次都报错,才会报错,如果三次之中有一次成功,就成功
@retry(stop_max_attempt_number=3)
def get_response(url):
 response = requests.get(url, timeout=2)
 return response
retrying_requests = get_response("https://www.baidu.com")
print(retrying_requests.content.decode())

cookie设置

好处:能够访问登录后的页面

坏处:一套cookie往往对应的是一个用户的信息,请求太频繁有更大的可能性被对方识别为爬虫
如何解决 ?使用多个账号

# 使用requests提供的session模块
import requests
# 构造formdata表单数据,填写自己的账号和密码
post_data = {
 "username": "xxxxx",
 "password": "xxxxx"
}
# session的使用: 在请求之前创建session对象
session = requests.Session()
# 后续的请求都由session来发起,因为session中保存了用户的登陆信息
session.post(url="https://www.baidu.com", data=post_data)
response = session.get("https://www.baidu.com")
# 使用session请求登陆后的界面
print(response.content.decode())

处理证书认证错误

import requests
# 方式一:不验证证书,报警告,返回200
requests.packages.urllib3.disable_warnings()# 直接解决爆红警告

# 方式二不验证证书,报警告,返回200 ,后面拼接verify=False,加这个控制台报警的话,就在加上方式一
response = requests.get('https://www.12306.cn',verify=False)
print(response.content.decode('utf-8'))

# 方式三:安装pyopenssl 安装之后就不会报错# pip3 install -U requests[security] 
response = requests.get('https://www.12306.cn')
print(response.content.decode('utf-8'))

# 方式四: 加上证书 公司内部 问开发要xxx.crt文件 ,最稳妥
response = requests.get('https://www.12306.cn',cert=('/path/server.crt', '/path/key'))

requests+jsonpath解析数据

hosts = 'https://api.weixin.qq.com' # 主机地址
# 获取token
get_param_dict = {
 "grant_type":"**********",
 "appid":"*************",
 "secret":"***************"
}
response = requests.get('%s/cgi-bin/token'%hosts,params=get_param_dict)
json_obj = response.json()
 # json数据解析:从一个json体中取出需要的数据,就叫json数据解析
token_id = jsonpath.jsonpath(json_obj,'$.access_token')[0] # 接口依赖,接口关联
print(token_id)

以上就是python requests模块的使用的详细内容,更多关于python requests模块的使用的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python实现在目录中查找指定文件的方法
Nov 11 Python
Windows下PyMongo下载及安装教程
Apr 27 Python
深入学习python的yield和generator
Mar 10 Python
在Django中进行用户注册和邮箱验证的方法
May 09 Python
python中os和sys模块的区别与常用方法总结
Nov 14 Python
python实现自动发送邮件发送多人、群发、多附件的示例
Jan 23 Python
python 切换root 执行命令的方法
Jan 19 Python
对python3中, print横向输出的方法详解
Jan 28 Python
python 模拟银行转账功能过程详解
Aug 06 Python
python闭包、深浅拷贝、垃圾回收、with语句知识点汇总
Mar 11 Python
Python模拟登录和登录跳转的参考示例
Oct 30 Python
Python爬虫:从m3u8文件里提取小视频的正确操作
May 14 Python
Python 使用dict实现switch的操作
Apr 07 #Python
Python 把两层列表展开平铺成一层(5种实现方式)
Apr 07 #Python
Python获取百度热搜的完整代码
详解Python小数据池和代码块缓存机制
Apr 07 #Python
浅谈Python列表嵌套字典转化的问题
Apr 07 #Python
python pyhs2 的安装操作
Apr 07 #Python
python3 sqlite3限制条件查询的操作
Apr 07 #Python
You might like
php设计模式 Prototype (原型模式)代码
2011/06/26 PHP
生成随机字符串和验证码的类的PHP实例
2013/12/24 PHP
PHP正则替换函数preg_replace和preg_replace_callback使用总结
2014/09/22 PHP
详细解读PHP的Yii框架中登陆功能的实现
2015/08/21 PHP
分享50个提高PHP执行效率的技巧
2015/12/26 PHP
PHP数组操作简单案例分析
2016/10/15 PHP
Nginx+php配置文件及原理解析
2020/12/09 PHP
select 控制网页内容隐藏于显示的实现代码
2010/05/25 Javascript
jquery 插件学习(六)
2012/08/06 Javascript
jQuery实现页面滚动时层智能浮动定位实例探讨
2013/03/29 Javascript
使用jQuery清空file文件域的解决方案
2013/04/12 Javascript
jquery动态更换设置背景图的方法
2014/03/25 Javascript
table行随鼠标移动变色示例
2014/05/07 Javascript
jquery获取及设置outerhtml的方法
2015/03/09 Javascript
Bootstrap导航条可点击和鼠标悬停显示下拉菜单的实现代码
2016/06/23 Javascript
JavaScript动态添加css样式和script标签
2016/07/19 Javascript
详解Angular 中 ngOnInit 和 constructor 使用场景
2017/06/22 Javascript
使用node-media-server搭建一个简易的流媒体服务器
2021/01/20 Javascript
[02:23]2018DOTA2亚洲邀请赛趣味视频——反应测试
2018/04/04 DOTA
python中pygame模块用法实例
2014/10/09 Python
Python函数参数类型*、**的区别
2015/04/11 Python
在Lighttpd服务器中运行Django应用的方法
2015/07/22 Python
Python模块结构与布局操作方法实例分析
2017/07/24 Python
Python中使用支持向量机SVM实践
2017/12/27 Python
详解PyCharm+QTDesigner+PyUIC使用教程
2019/06/13 Python
django 数据库连接模块解析及简单长连接改造方法
2019/08/29 Python
在html页面中取得session中的值的方法
2020/08/11 HTML / CSS
流行文化收藏品:Sideshow(DC漫画,星球大战,漫威)
2019/03/17 全球购物
CHARLES & KEITH台湾官网:新加坡时尚品牌
2019/07/30 全球购物
经典优秀个人求职自荐信格式
2013/09/25 职场文书
降消项目实施方案
2014/03/30 职场文书
行政文员实习自我鉴定范文
2014/09/14 职场文书
慰问信范文
2015/02/14 职场文书
新员工入职感想
2015/08/07 职场文书
mysql字符串截取函数小结
2021/04/05 MySQL
Python入门之使用pandas分析excel数据
2021/05/12 Python