解决python3中的requests解析中文页面出现乱码问题


Posted in Python onApril 19, 2019

第一部分 关于requests库

(1) requests是一个很实用的Python HTTP客户端库,编写爬虫和测试服务器响应数据时经常会用到。

(2) 其中的Request对象在访问服务器后会返回一个Response对象,这个对象将返回的Http响应字节码保存到content属性中。

(3) 但是如果你访问另一个属性text时,会返回一个unicode对象,乱码问题就会常常发成在这里。

(4) 因为Response对象会通过另一个属性encoding来将字节码编码成unicode,而这个encoding属性居然是responses自己猜出来的。

第二部分 解决方法

所以要么你直接使用content(字节码),要么记得把encoding设置正确,比如我获取了一段gbk编码的网页,就需要以下方法才能得到正确的unicode。

import requests
url = "http://xxx.xxx.xxx"
response = requests.get(url)
response.encoding = 'gbk'
print(response.text)

总结

以上所述是小编给大家介绍的解决python3中的requests解析中文页面出现乱码问题,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
Python 字典与字符串的互转实例
Jan 13 Python
python django 访问静态文件出现404或500错误
Jan 20 Python
Flask web开发处理POST请求实现(登录案例)
Jul 26 Python
python中dir()与__dict__属性的区别浅析
Dec 10 Python
selenium在执行phantomjs的API并获取执行结果的方法
Dec 17 Python
python根据url地址下载小文件的实例
Dec 18 Python
详解Django中CBV(Class Base Views)模型源码分析
Feb 25 Python
华为2019校招笔试题之处理字符串(python版)
Jun 25 Python
Django使用中间键实现csrf认证详解
Jul 22 Python
Python openpyxl模块实现excel读写操作
Jun 30 Python
解决TensorFlow调用Keras库函数存在的问题
Jul 06 Python
python excel和yaml文件的读取封装
Jan 12 Python
Python3中列表list合并的四种方法
Apr 19 #Python
局域网内python socket实现windows与linux间的消息传送
Apr 19 #Python
python定时按日期备份MySQL数据并压缩
Apr 19 #Python
Python实现 版本号对比功能的实例代码
Apr 18 #Python
Python网络爬虫之爬取微博热搜
Apr 18 #Python
python学习——内置函数、数据结构、标准库的技巧(推荐)
Apr 18 #Python
详解python 模拟豆瓣登录(豆瓣6.0)
Apr 18 #Python
You might like
php正则匹配html中带class的div并选取其中内容的方法
2015/01/13 PHP
如何通过Linux命令行使用和运行PHP脚本
2015/07/29 PHP
3种方法轻松处理php开发中emoji表情的问题
2016/07/18 PHP
php 类中的常量、静态属性、非静态属性的区别
2017/04/09 PHP
PHP实现驼峰样式字符串(首字母大写)转换成下划线样式字符串的方法示例
2017/08/10 PHP
PHP常用函数之base64图片上传功能详解
2019/10/21 PHP
jQuery数组处理方法汇总
2011/06/20 Javascript
JS获取select-option-text_value的方法
2013/12/26 Javascript
浅谈jQuery事件绑定原理
2015/01/02 Javascript
JavaScript中的分号插入机制详细介绍
2015/02/11 Javascript
利用jquery制作滚动到指定位置触发动画
2016/03/26 Javascript
webpack常用配置项配置文件介绍
2016/11/07 Javascript
js原生之焦点图转换加定时器实例
2016/12/12 Javascript
Angular.js与node.js项目里用cookie校验账户登录详解
2017/02/22 Javascript
bootstrap3使用bootstrap datetimepicker日期插件
2017/05/24 Javascript
angular2中Http请求原理与用法详解
2018/01/11 Javascript
JS中注入eval, Function等系统函数截获动态代码
2019/04/03 Javascript
JavaScript中判断为整数的多种方式及保留两位小数的方法
2019/09/09 Javascript
Python使用Windows API创建窗口示例【基于win32gui模块】
2018/05/09 Python
基于python神经卷积网络的人脸识别
2018/05/24 Python
浅析Python四种数据类型
2018/09/26 Python
python遍历文件夹找出文件夹后缀为py的文件方法
2018/10/21 Python
python多线程并发让两个LED同时亮的方法
2019/02/18 Python
十个Python练手的实战项目,学会这些Python就基本没问题了(推荐)
2019/04/26 Python
python实现微信机器人: 登录微信、消息接收、自动回复功能
2019/04/29 Python
python画蝴蝶曲线图的实例
2019/11/21 Python
解决pytorch多GPU训练保存的模型,在单GPU环境下加载出错问题
2020/06/23 Python
详解Python 循环嵌套
2020/07/09 Python
python使用列表的最佳方案
2020/08/12 Python
针对HTML5的Web Worker使用攻略
2015/07/12 HTML / CSS
车库门开启器、遥控器和零件:Chamberlain
2019/04/09 全球购物
中学教师教育感言
2014/02/21 职场文书
平面设计专业求职信
2014/08/09 职场文书
我爱幼儿园演讲稿
2014/09/11 职场文书
2016同学毕业寄语大全
2015/12/04 职场文书
《和时间赛跑》读后感3篇
2019/12/16 职场文书