解决python3中的requests解析中文页面出现乱码问题


Posted in Python onApril 19, 2019

第一部分 关于requests库

(1) requests是一个很实用的Python HTTP客户端库,编写爬虫和测试服务器响应数据时经常会用到。

(2) 其中的Request对象在访问服务器后会返回一个Response对象,这个对象将返回的Http响应字节码保存到content属性中。

(3) 但是如果你访问另一个属性text时,会返回一个unicode对象,乱码问题就会常常发成在这里。

(4) 因为Response对象会通过另一个属性encoding来将字节码编码成unicode,而这个encoding属性居然是responses自己猜出来的。

第二部分 解决方法

所以要么你直接使用content(字节码),要么记得把encoding设置正确,比如我获取了一段gbk编码的网页,就需要以下方法才能得到正确的unicode。

import requests
url = "http://xxx.xxx.xxx"
response = requests.get(url)
response.encoding = 'gbk'
print(response.text)

总结

以上所述是小编给大家介绍的解决python3中的requests解析中文页面出现乱码问题,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
python基础教程之元组操作使用详解
Mar 25 Python
使用httplib模块来制作Python下HTTP客户端的方法
Jun 19 Python
详解Python验证码识别
Jan 25 Python
python 删除列表里所有空格项的方法总结
Apr 18 Python
Python面向对象程序设计之继承与多继承用法分析
Jul 13 Python
如何在Python中实现goto语句的方法
May 18 Python
Python 如何提高元组的可读性
Aug 26 Python
在django中使用apscheduler 执行计划任务的实现方法
Feb 11 Python
Python requests设置代理的方法步骤
Feb 23 Python
Python3 中sorted() 函数的用法
Mar 24 Python
Python打印特殊符号及对应编码解析
May 07 Python
python读取excel数据绘制简单曲线图的完整步骤记录
Oct 30 Python
Python3中列表list合并的四种方法
Apr 19 #Python
局域网内python socket实现windows与linux间的消息传送
Apr 19 #Python
python定时按日期备份MySQL数据并压缩
Apr 19 #Python
Python实现 版本号对比功能的实例代码
Apr 18 #Python
Python网络爬虫之爬取微博热搜
Apr 18 #Python
python学习——内置函数、数据结构、标准库的技巧(推荐)
Apr 18 #Python
详解python 模拟豆瓣登录(豆瓣6.0)
Apr 18 #Python
You might like
PHP中调用JAVA
2006/10/09 PHP
用 php 编写的日历
2006/10/09 PHP
php引用计数器进行垃圾收集机制介绍
2012/09/19 PHP
PHP常用特殊运算符号和函数总结(php新手入门必看)
2013/02/02 PHP
PHP中把有符号整型转换为无符号整型方法
2015/05/27 PHP
ThinkPHP整合datatables实现服务端分页的示例代码
2018/02/10 PHP
关于Laravel参数验证的一些疑与惑
2019/11/19 PHP
laravel邮件发送的实现代码示例
2020/01/31 PHP
Html中JS脚本执行顺序简单举例说明
2010/06/19 Javascript
js播放wav文件(源码)
2013/04/22 Javascript
footer定位页面底部(代码分享)
2017/03/07 Javascript
js canvas实现放大镜查看图片功能
2017/06/08 Javascript
Bootstrap弹出框(Popover)被挤压的问题小结
2017/07/11 Javascript
详解win7 cmd执行vue不是内部命令的解决方法
2017/07/27 Javascript
vue自定义全局共用函数详解
2018/09/18 Javascript
开发用到的js封装方法(20种)
2018/10/12 Javascript
jquery实现Ajax请求的几种常见方式总结
2019/05/28 jQuery
深入了解JavaScript 私有化
2019/05/30 Javascript
Python入门篇之文件
2014/10/20 Python
Python使用matplotlib填充图形指定区域代码示例
2018/01/16 Python
Opencv+Python 色彩通道拆分及合并的示例
2018/12/08 Python
我们为什么要减少Python中循环的使用
2019/07/10 Python
Python交互式图形编程的实现
2019/07/25 Python
分享8点超级有用的Python编程建议(推荐)
2019/10/13 Python
python中的Elasticsearch操作汇总
2019/10/30 Python
python SVD压缩图像的实现代码
2019/11/05 Python
Python3直接爬取图片URL并保存示例
2019/12/18 Python
python实现将列表中各个值快速赋值给多个变量
2020/04/02 Python
IE支持HTML5的解决方法
2009/10/20 HTML / CSS
英国历史最悠久的DJ设备供应商:DJ Finance、DJ Warehouse、The DJ Shop
2019/09/04 全球购物
俄罗斯香水和化妆品在线商店:Aroma-butik
2020/02/28 全球购物
C#的几个面试问题
2016/05/22 面试题
高中运动会入场词
2014/02/14 职场文书
《守株待兔》教学反思
2014/03/01 职场文书
银行求职自荐信范文
2015/03/04 职场文书
教学督导岗位职责
2015/04/10 职场文书