编程 Python

Python中request的基本使用解决乱码问题

Posted in Python onApril 12, 2022

各种请求方式

pip3 install requests
&gt;&gt;&gt; import requests
&gt;&gt;&gt; r = requests.get('https://www.cnblogs.com')
&gt;&gt;&gt; r = requests.post('https://www.cnblogs.com', data = {'key':'value'})
&gt;&gt;&gt; r = requests.put('https://www.cnblogs.com', data = {'key':'value'})
&gt;&gt;&gt; r = requests.delete('https://www.cnblogs.com')
&gt;&gt;&gt; r = requests.head('https://www.cnblogs.com')
&gt;&gt;&gt; r = requests.options('https://www.cnblogs.com')

request各种参数

参数	说明
params	字典或字节序列，作为参数增加到url中
data	字典，字节序列或文件对象，作为request的内容
json	JSON格式的数据，作为request的内容
headers	字典，HTTP定制头
cookies	字典或CookieJar， request中的cookie
auth	元组，支持HTTp认证功能
files	字典类型，传输文件
timeout	设定超时时间，秒为单位
proxies	字典类型，设定访问代理服务器，可以增加登录认证
allow_redirects	重定向开关，默认为True
stream	获取内容立即下载开关，默认为True
verify	认证SSL证书开关，默认为True
cert	本地SSL证书路径

request基本使用

import requests
response = requests.get('https://www.cnblogs.com/kermitjam/')
print(response.text)

print(respone.text)  # 响应体转成str
print(respone.content)  # 响应体二进制（图片，视频）
print(respone.status_code)  # 响应状态码
print(respone.headers)  # 响应头
print(respone.cookies)  # 服务端返回的cookie
print(respone.cookies.get_dict())  # 转成字典
print(respone.cookies.items())
print(respone.url)  # 当次请求的地址
print(respone.history)  # 如果有重定向，放到一个列表中.查看上一次请求从哪里来。(图片防盗链)
print(respone.encoding)  # 编码方式
print(respone.iter_content())  # 视频，图片迭代取值
content-length   # 查看下载前文件大小


response.iter_content() # 视频，图片迭代取值
with open("a.mp4",'wb') as f:
    for line in response.iter_content():
        f.write(line)

get请求携带参数

# 方式一：会转码,不推荐
response = requests.get('https://www.baidu.com/s?wd=%E7%BE%8E%E5%A5%B3')

# 方式二：推荐
response = requests.get('https://www.baidu.com/',params={'name':'美女','age':18})

get请求携带headers头

respone = requests.get('http://127.0.0.1:8000/',params={'name':'美女','age':18},
                   headers={
                       # 标志，什么东西发出的请求，浏览器信息，django框架，从哪取？（meta）
                       'User-Agent': 'request',
                       # 上一个页面的地址，图片防盗链
                       'Referer': 'xxx'
                   })
print(respone.status_code)

get请求携带cookie

带cookie,随机字符串(用户信息：也代表session)，不管后台用的token认证，还是session认证

一旦登陆了，带着cookie发送请求，表示登陆了（下单，12306买票，评论）

# 第一种方式
ret = requests.get('http://127.0.0.1:8000/',params={'name':'美女','age':18},
                   headers={
                       'cookie': 'key3=value;key2=value',
                   })

# 第二种方式
ret = requests.get('http://127.0.0.1:8000/',params={'name':'美女','age':18},
                   cookies={"islogin":"xxx"})
print(ret.status_code)

post请求携带数据(注册、登录)

# data:urlencoded编码
ret = requests.post('http://127.0.0.1:8000/', data={'name': "jeff", 'age': 18})


# data:json编码
import json
data = json.dumps({'name': "jeff", 'age': 18})
ret = requests.post('http://127.0.0.1:8000/', json=data)
print(ret)
# 注意：编码格式是请求头中带的，所以可以手动修改，在headers中改

session对象

# session对象
session=requests.session()
# 跟requests.get/post用起来完全一样，但是它处理了cookie
# 假设是一个登陆，并且成功
res = session.post('http://127.0.0.1:8000/')
# # 再向该网站发请求，就是登陆状态，不需要手动携带cookie
res = session.get("http://127.0.0.1:8000/")

print(res)

乱码问题

# 加载回来的页面，打印出来，乱码（我们用的是utf8编码），如果网站用gbk，

ret = requests.get('http://127.0.0.1:8000/')
ret.encoding='gbk'  # 修改编码

print(ret.apparent_encoding)  # 当前页面的编码
# ret.encoding = ret.apparent_encoding
print(ret.encoding)
print(ret.apparent_encoding)

解析json数据

# 返回数据，有可能是json格式，有可能是html格式
ret=requests.get('http://127.0.0.1:8000/')
# print(type(ret.text))
# print(ret.text)

a=ret.json()
print(a['name'])
print(type(a))

使用代理

代理简单解释：
	代理其实就是一个中介，A和B本来可以直连，中间插入一个C，C就是中介。
	
#高匿：服务端，根本不知道我是谁
#普通：服务端是能够知道我的ip的
#http请求头中：X-Forwarded-For：代理的过程

爬虫使用正向代理好处：
	1.突破频率限制。做个代理池，每次请求都是不同的Ip,服务器认为是不同的用户
	2.不会封自己的ip。

正向代理即是客户端代理, 代理客户端, 服务端不知道实际发起请求的客户端.
反向代理即是服务端代理, 代理服务端, 客户端不知道实际提供服务的服务端

ret = requests.get('https://www.pearvideo.com/', proxies={'http': '47.115.54.89'})
print(type(ret.text))
print(ret.text)

上传文件

# 爬虫用的比较少，后台写服务

file = {'myfile': open("1.txt", 'rb')}
ret = requests.post('http://127.0.0.1:8000/', files=file)
print(ret.content)

以上就是request基本使用及各种请求方式参数的示例的详细内容！

Python中request的基本使用解决乱码问题

- Author -

Jeff的技术栈

- Original Sources -

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python中的lstrip()方法使用简介

May 19 Python

django之常用命令详解

Jun 30 Python

python 实现删除文件或文件夹实例详解

Dec 04 Python

Pycharm学习教程（7）虚拟机VM的配置教程

May 04 Python

Python通过命令开启http.server服务器的方法

Nov 04 Python

Django使用HttpResponse返回图片并显示的方法

May 22 Python

python 数据提取及拆分的实现代码

Aug 26 Python

Python求平面内点到直线距离的实现

Jan 19 Python

python计算导数并绘图的实例

Feb 29 Python

python使用QQ邮箱实现自动发送邮件

Jun 22 Python

python开发的自动化运维工具ansible详解

Aug 07 Python

python中urllib包的网络请求教程

Apr 19 Python

python模拟浏览器使用selenium进入好友QQ空间并留言

Python安装使用Scrapy框架

Python使用华为API为图像设置多个锚点标签

python实现手机推送代码也就10行左右

Apr 12 #Python

Python内置包对JSON文件数据进行编码和解码

详细介绍python操作RabbitMq

Python selenium绕过webdriver监测执行javascript

Apr 12 #Python

You might like

PHP JSON格式数据交互实例代码详解

2011/01/13 PHP

php中使用url传递数组的方法

2015/02/11 PHP

Linux系统下php获得系统分区信息的方法

2015/03/30 PHP

PHP设计模式之单例模式定义与用法分析

2019/03/26 PHP

jQuery 类twitter的文本字数限制带提示效果插件

2010/04/16 Javascript

jQuery源码分析-03构造jQuery对象-工具函数

2011/11/14 Javascript

JavaScript打开word文档的实现代码(c#)

2012/04/16 Javascript

javascript实现倒计时N秒后网页自动跳转代码

2014/12/11 Javascript

js Calender控件使用详解

2015/01/05 Javascript

详解javascript中的事件处理

2015/11/06 Javascript

基于MVC4+EasyUI的Web开发框架形成之旅之界面控件的使用

2015/12/16 Javascript

jQuery实现模仿微博下拉滚动条加载数据效果

2015/12/25 Javascript

BootStrap学习系列之Bootstrap Typeahead 组件实现百度下拉效果(续)

2016/07/07 Javascript

JavaScript中如何使用cookie实现记住密码功能及cookie相关函数介绍

2016/11/10 Javascript

jQuery编写网页版2048小游戏

2017/01/06 Javascript

Bootstrap 表单验证formValidation 实现表单动态验证功能

2017/05/17 Javascript

Vue.js做select下拉列表的实例(ul-li标签仿select标签)

2018/03/02 Javascript

详解Vue中使用Echarts的两种方式

2018/07/03 Javascript

浅谈在vue中使用mint-ui swipe遇到的问题

2018/09/27 Javascript

Vue中的vue-resource示例详解

2018/11/02 Javascript

[01:09]2014DOTA2国际邀请赛 TI4西雅图DOTA2 中国美女coser加油助威

2014/07/20 DOTA

[39:52]2018DOTA2亚洲邀请赛 4.3 突围赛 EG vs Newbee 第一场

2018/04/04 DOTA

Python画图学习入门教程

2016/07/01 Python

Python中元组,列表,字典的区别

2017/05/21 Python

Python中pygal绘制雷达图代码分享

2017/12/07 Python

Python3.6通过自带的urllib通过get或post方法请求url的实例

2018/05/10 Python

Python中asyncio模块的深入讲解

2019/06/10 Python

HTML5探秘：用requestAnimationFrame优化Web动画

2018/06/03 HTML / CSS

联想西班牙官网：Lenovo西班牙

2018/08/28 全球购物

学生宿舍管理制度

2014/01/30 职场文书

2014年基层党建工作总结

2014/11/11 职场文书

离婚代理词范文

2015/05/23 职场文书

工伤劳动仲裁代理词

2015/05/25 职场文书

详解redis在微服务领域的贡献

2021/10/16 Redis

JavaScript实现外溢动态爱心的效果的示例代码

2022/03/21 Javascript

Redis+AOP+自定义注解实现限流

2022/06/28 Redis