解决python3中的requests解析中文页面出现乱码问题


Posted in Python onApril 19, 2019

第一部分 关于requests库

(1) requests是一个很实用的Python HTTP客户端库,编写爬虫和测试服务器响应数据时经常会用到。

(2) 其中的Request对象在访问服务器后会返回一个Response对象,这个对象将返回的Http响应字节码保存到content属性中。

(3) 但是如果你访问另一个属性text时,会返回一个unicode对象,乱码问题就会常常发成在这里。

(4) 因为Response对象会通过另一个属性encoding来将字节码编码成unicode,而这个encoding属性居然是responses自己猜出来的。

第二部分 解决方法

所以要么你直接使用content(字节码),要么记得把encoding设置正确,比如我获取了一段gbk编码的网页,就需要以下方法才能得到正确的unicode。

import requests
url = "http://xxx.xxx.xxx"
response = requests.get(url)
response.encoding = 'gbk'
print(response.text)

总结

以上所述是小编给大家介绍的解决python3中的requests解析中文页面出现乱码问题,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
python3使用urllib示例取googletranslate(谷歌翻译)
Jan 23 Python
Python入门_浅谈字符串的分片与索引、字符串的方法
May 16 Python
详解Python 序列化Serialize 和 反序列化Deserialize
Aug 20 Python
Python实现爬虫抓取与读写、追加到excel文件操作示例
Jun 27 Python
浅谈python常用程序算法
Mar 22 Python
对django layer弹窗组件的使用详解
Aug 31 Python
python数值基础知识浅析
Nov 19 Python
Python异常原理及异常捕捉实现过程解析
Mar 25 Python
浅谈keras中的目标函数和优化函数MSE用法
Jun 10 Python
Django如何实现防止XSS攻击
Oct 13 Python
python 实现音频叠加的示例
Oct 29 Python
Python 如何解决稀疏矩阵运算
May 26 Python
Python3中列表list合并的四种方法
Apr 19 #Python
局域网内python socket实现windows与linux间的消息传送
Apr 19 #Python
python定时按日期备份MySQL数据并压缩
Apr 19 #Python
Python实现 版本号对比功能的实例代码
Apr 18 #Python
Python网络爬虫之爬取微博热搜
Apr 18 #Python
python学习——内置函数、数据结构、标准库的技巧(推荐)
Apr 18 #Python
详解python 模拟豆瓣登录(豆瓣6.0)
Apr 18 #Python
You might like
随机头像PHP版
2006/10/09 PHP
jquery 应用代码 方便的排序功能
2010/02/06 Javascript
基于jQuery架构javascript基础体系
2011/01/01 Javascript
JSDoc 介绍使用规范JsDoc的使用介绍
2011/02/12 Javascript
js从10种颜色中随机取色实现每次取出不同的颜色
2013/10/23 Javascript
js实现动态改变字体大小代码
2014/01/02 Javascript
浅谈JSON中stringify 函数、toJosn函数和parse函数
2015/01/26 Javascript
javascript数组去重的六种方法汇总
2015/08/16 Javascript
详解JavaScript的变量和数据类型
2015/11/27 Javascript
当jquery ajax遇上401请求的解决方法
2016/05/19 Javascript
js使用generator函数同步执行ajax任务
2017/09/05 Javascript
关于vue-router的beforeEach无限循环的问题解决
2017/09/09 Javascript
Vue filter介绍及其使用详解
2017/10/21 Javascript
JS Input里添加小图标的两种方法
2017/11/11 Javascript
layui扩展上传组件模拟进度条的方法
2019/09/23 Javascript
Vue+Vuex实现自动登录的知识点详解
2020/03/04 Javascript
JavaScript实现鼠标经过表格某行时此行变色
2020/11/20 Javascript
python中bisect模块用法实例
2014/09/25 Python
Python实现的多线程http压力测试代码
2017/02/08 Python
机器学习10大经典算法详解
2017/12/07 Python
Python猴子补丁Monkey Patch用法实例解析
2020/03/23 Python
解决pytorch多GPU训练保存的模型,在单GPU环境下加载出错问题
2020/06/23 Python
用python实现前向分词最大匹配算法的示例代码
2020/08/06 Python
Python类成员继承重写的实现
2020/09/16 Python
Pycharm新手使用教程(图文详解)
2020/09/17 Python
Python实现Excel自动分组合并单元格
2021/02/22 Python
phonegap常用事件总结(必看篇)
2017/03/31 HTML / CSS
美国体育用品商店:Rally House(NCAA、NFL、MLB、NBA、NHL和MLS)
2018/01/03 全球购物
大学生大二自我鉴定
2013/10/28 职场文书
面试必备的求职信
2014/05/25 职场文书
公司授权委托书范本
2014/09/18 职场文书
交警作风整顿剖析材料
2014/10/11 职场文书
泰坦尼克号观后感
2015/06/04 职场文书
西游记读书笔记
2015/06/25 职场文书
优秀创业计划书分享
2019/07/19 职场文书
学者《孟子》名人名言
2019/08/09 职场文书