浅谈Python2之汉字编码为unicode的问题(即类似\xc3\xa4)


Posted in Python onAugust 12, 2019

Python2中编码相关的问题很是让人蛋疼,特别是中文字符。

比如本文所述的中文网页GBK编码的诡异问题。

现象

例如:盲录?氓??,其实网页里面正常的应该是会员

分析

接着上面的例子,会员这部分乱码通过repr()函数求值得到如下结果

\xc3\xa4\xc2\xbc\xc2\x9a\xc3\xa5\xc2\x91\xc2\x98

使用type()函数求值得到的结果为unicode

eval(repr())出来值为

盲录?氓??

通过查表上述6个汉字对应

c3a4 c2bc c29a c3a5 c291 c298

而上面内容对应的UTF-8值就是会员

解决方法

相当诡异的是本身是unicode编码,却被当作GBK系列来解码,结果导致乱码。因此将这些字符先编码再解决解决问题。

encode('raw_unicode_escape').decode()

以上这篇浅谈Python2之汉字编码为unicode的问题(即类似\xc3\xa4)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
在python中的socket模块使用代理实例
May 29 Python
python 第三方库的安装及pip的使用详解
May 11 Python
高质量Python代码编写的5个优化技巧
Nov 16 Python
python实现最长公共子序列
May 22 Python
python selenium自动上传有赞单号的操作方法
Jul 05 Python
tensorflow 加载部分变量的实例讲解
Jul 27 Python
利用python脚本如何简化jar操作命令
Feb 24 Python
Python用Try语句捕获异常的实例方法
Jun 26 Python
python 并发编程 多路复用IO模型详解
Aug 20 Python
python 回溯法模板详解
Feb 26 Python
jupyter notebook 写代码自动补全的实现
Nov 02 Python
python自动从arxiv下载paper的示例代码
Dec 05 Python
基于Python2、Python3中reload()的不同用法介绍
Aug 12 #Python
Python递归函数 二分查找算法实现解析
Aug 12 #Python
基于Python安装pyecharts所遇的问题及解决方法
Aug 12 #Python
Django实现发送邮件找回密码功能
Aug 12 #Python
使用pyecharts生成Echarts网页的实例
Aug 12 #Python
10分钟教你用python动画演示深度优先算法搜寻逃出迷宫的路径
Aug 12 #Python
python利用itertools生成密码字典并多线程撞库破解rar密码
Aug 12 #Python
You might like
php中去除所有js,html,css代码
2010/10/12 PHP
解决文件名解压后乱码的问题 将文件名进行转码的代码
2012/01/10 PHP
基于php iconv函数的使用详解
2013/06/09 PHP
JavaScript使用技巧精萃[代码非常实用]
2008/11/21 Javascript
Javascript 复制数组实现代码
2009/11/26 Javascript
ImageZoom 图片放大镜效果(多功能扩展篇)
2010/04/14 Javascript
ExtJs Excel导出并下载IIS服务器端遇到的问题
2011/09/16 Javascript
javascript学习笔记(十一) 正则表达式介绍
2012/06/20 Javascript
验证手机号码的JS方法分享
2013/09/10 Javascript
用js将内容复制到剪贴板兼容浏览器
2014/03/18 Javascript
Node.js中的模块机制学习笔记
2014/11/04 Javascript
对js eval()函数的一些见解
2016/08/15 Javascript
canvas实现环形进度条效果
2017/03/23 Javascript
layer子层给父层页面元素赋值,以达到向父层页面传值的效果实例
2017/09/22 Javascript
解决vue this.$forceUpdate() 处理页面刷新问题(v-for循环值刷新等)
2018/07/26 Javascript
js中事件对象和事件委托的介绍
2019/01/21 Javascript
swiper4实现移动端导航切换
2020/10/16 Javascript
使用layui实现的左侧菜单栏以及动态操作tab项方法
2019/09/10 Javascript
如何在vue项目中嵌入jsp页面的方法(2种)
2020/02/06 Javascript
javascript异常处理实现原理详解
2020/02/17 Javascript
[15:39]教你分分钟做大人:龙骑士
2014/10/30 DOTA
[00:27]DOTA2次级职业联赛 - Lilith战队宣传片
2014/12/01 DOTA
Python卸载模块的方法汇总
2016/06/07 Python
django项目运行因中文而乱码报错的几种情况解决
2017/11/07 Python
python/sympy求解矩阵方程的方法
2018/11/08 Python
python数据分析:关键字提取方式
2020/02/24 Python
python 调用API接口 获取和解析 Json数据
2020/09/28 Python
使用Python判断一个文件是否被占用的方法教程
2020/12/16 Python
CSS3 实现的缩略图悬停效果
2020/12/09 HTML / CSS
南京软件公司的.net程序员笔试题
2014/08/31 面试题
学校与家长安全责任书
2014/07/23 职场文书
物流管理专业推荐信
2014/09/06 职场文书
关于运动会的广播稿
2014/09/22 职场文书
科级干部培训心得体会
2016/01/06 职场文书
【海涛dota】偶遇拉娜娅 质量局德鲁伊第一视角解说
2022/04/01 DOTA
windows server2016安装oracle 11g的图文教程
2022/07/15 Servers