浅谈Python2之汉字编码为unicode的问题(即类似\xc3\xa4)


Posted in Python onAugust 12, 2019

Python2中编码相关的问题很是让人蛋疼,特别是中文字符。

比如本文所述的中文网页GBK编码的诡异问题。

现象

例如:盲录?氓??,其实网页里面正常的应该是会员

分析

接着上面的例子,会员这部分乱码通过repr()函数求值得到如下结果

\xc3\xa4\xc2\xbc\xc2\x9a\xc3\xa5\xc2\x91\xc2\x98

使用type()函数求值得到的结果为unicode

eval(repr())出来值为

盲录?氓??

通过查表上述6个汉字对应

c3a4 c2bc c29a c3a5 c291 c298

而上面内容对应的UTF-8值就是会员

解决方法

相当诡异的是本身是unicode编码,却被当作GBK系列来解码,结果导致乱码。因此将这些字符先编码再解决解决问题。

encode('raw_unicode_escape').decode()

以上这篇浅谈Python2之汉字编码为unicode的问题(即类似\xc3\xa4)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python Mysql数据库操作 Perl操作Mysql数据库
Jan 12 Python
python中 logging的使用详解
Oct 25 Python
python的Crypto模块实现AES加密实例代码
Jan 22 Python
在ubuntu16.04中将python3设置为默认的命令写法
Oct 31 Python
Python设计模式之简单工厂模式实例详解
Jan 22 Python
浅谈python之高阶函数和匿名函数
Mar 21 Python
Python求两点之间的直线距离(2种实现方法)
Jul 07 Python
Python hashlib加密模块常用方法解析
Dec 18 Python
使用python实现希尔、计数、基数基础排序的代码
Dec 25 Python
Django migrate报错的解决方案
May 20 Python
Python基础之进程详解
May 21 Python
Python循环之while无限迭代
Apr 30 Python
基于Python2、Python3中reload()的不同用法介绍
Aug 12 #Python
Python递归函数 二分查找算法实现解析
Aug 12 #Python
基于Python安装pyecharts所遇的问题及解决方法
Aug 12 #Python
Django实现发送邮件找回密码功能
Aug 12 #Python
使用pyecharts生成Echarts网页的实例
Aug 12 #Python
10分钟教你用python动画演示深度优先算法搜寻逃出迷宫的路径
Aug 12 #Python
python利用itertools生成密码字典并多线程撞库破解rar密码
Aug 12 #Python
You might like
yii实现使用CUploadedFile上传文件的方法
2015/12/28 PHP
详谈PHP面向对象中常用的关键字和魔术方法
2017/02/04 PHP
php的PDO事务处理机制实例分析
2017/02/16 PHP
Discuz不使用插件实现简单的打赏功能
2019/03/21 PHP
再论Javascript下字符串连接的性能
2011/03/05 Javascript
jquery.Ajax()方法调用Asp.Net后台的方法解析
2014/02/13 Javascript
node.js中的fs.utimesSync方法使用说明
2014/12/15 Javascript
jQuery插件简单实现方法
2015/07/18 Javascript
JavaScript实现文字跟随鼠标特效
2015/08/06 Javascript
JavaScript实现的伸展收缩型菜单代码
2015/10/14 Javascript
详解vue组件通信的三种方式
2017/06/30 Javascript
详解webpack进阶之插件篇
2017/07/06 Javascript
[02:10]探秘浦东源深体育馆 DOTA2 Supermajor不见不散
2018/05/17 DOTA
利用Python爬虫给孩子起个好名字
2017/02/14 Python
python实现求解列表中元素的排列和组合问题
2018/03/15 Python
pycharm下查看python的变量类型和变量内容的方法
2018/06/26 Python
在Python中使用defaultdict初始化字典以及应用方法
2018/10/31 Python
Python 学习教程之networkx
2019/04/15 Python
Python数据类型之Number数字操作实例详解
2019/05/08 Python
python实现的读取网页并分词功能示例
2019/10/29 Python
mac使用python识别图形验证码功能
2020/01/10 Python
Python如何省略括号方法详解
2020/03/21 Python
Python使用Selenium模拟浏览器自动操作功能
2020/09/08 Python
一文带你掌握Pyecharts地理数据可视化的方法
2021/02/06 Python
CSS3模拟动画下拉菜单效果
2017/04/12 HTML / CSS
HTML5 CSS3打造相册效果附源码下载
2014/06/16 HTML / CSS
欧舒丹英国官网:购买欧舒丹护手霜等明星产品
2017/01/17 全球购物
全球最受追捧的运动服品牌领先数字目的地:Stylerunner
2020/11/25 全球购物
MediaMarkt比利时:欧洲最大电器连锁店
2020/12/21 全球购物
优秀的自荐信要注意哪些
2014/01/03 职场文书
小溪流的歌教学反思
2014/02/13 职场文书
商业项目策划方案
2014/06/05 职场文书
2015年董事长秘书工作总结
2015/07/23 职场文书
幼儿教师远程研修感悟
2015/11/18 职场文书
基于Redis实现分布式锁的方法(lua脚本版)
2021/05/12 Redis
Python编解码问题及文本文件处理方法详解
2021/06/20 Python