python去掉 unicode 字符串前面的u方法


Posted in Python onOctober 21, 2018

有时我们会碰到类似下面这样的 unicode 字符串:

u'\xe4\xbd\xa0\xe5\xa5\xbd'

这明显不是一个正确的 unicode 字符串,可能是在哪个地方转码转错了。

我们要想得到正确的 unicode 字符串首先就必须先将这个字符串转成非 unicode 字符串, 然后再进行解码。按照普通的办法进行 encode 肯定是不行的,因为这不是一个正确的 unicode 字符串:

In [1]: u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('utf8')
Out[1]: '\xc3\xa4\xc2\xbd\xc2\xa0\xc3\xa5\xc2\xa5\xc2\xbd'

In [2]: print u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('utf8')
盲陆?氓楼陆
那如何才能得到我们想要的 \xe4\xbd\xa0\xe5\xa5\xbd 呢?

python 提供了一个特殊的编码( raw_unicode_escape )用来处理这种情况:

In [4]: u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('raw_unicode_escape')
Out[4]: '\xe4\xbd\xa0\xe5\xa5\xbd'

In [5]: u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('raw_unicode_escape').decode('utf8')
Out[5]: u'\u4f60\u597d'

In [7]: print u'\u4f60\u597d'
你好

以上这篇python去掉 unicode 字符串前面的u方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python(Tornado)模拟登录小米抢手机
Nov 12 Python
10种检测Python程序运行时间、CPU和内存占用的方法
Apr 01 Python
简单理解Python中基于生成器的状态机
Apr 13 Python
利用Python自动监控网站并发送邮件告警的方法
Aug 24 Python
Python 基础教程之包和类的用法
Feb 23 Python
Pandas之Dropna滤除缺失数据的实现方法
Jun 25 Python
Django之模板层的实现代码
Sep 09 Python
python3 实现调用串口功能
Dec 26 Python
利用python实现.dcm格式图像转为.jpg格式
Jan 13 Python
10个python3常用排序算法详细说明与实例(快速排序,冒泡排序,桶排序,基数排序,堆排序,希尔排序,归并排序,计数排序)
Mar 17 Python
如何理解Python中包的引入
May 29 Python
Python 实现3种回归模型(Linear Regression,Lasso,Ridge)的示例
Oct 15 Python
python 分离文件名和路径以及分离文件名和后缀的方法
Oct 21 #Python
python之消除前缀重命名的方法
Oct 21 #Python
使用Scrapy爬取动态数据
Oct 21 #Python
python使用正则表达式来获取文件名的前缀方法
Oct 21 #Python
python遍历文件夹找出文件夹后缀为py的文件方法
Oct 21 #Python
python os.listdir按文件存取时间顺序列出目录的实例
Oct 21 #Python
python查找指定文件夹下所有文件并按修改时间倒序排列的方法
Oct 21 #Python
You might like
咖啡店都有些什么常规豆子呢?有什么风味在里面
2021/03/04 咖啡文化
php中最简单的字符串匹配算法
2014/12/16 PHP
php中mysql操作buffer用法详解
2015/03/19 PHP
php实现将任意进制数转换成10进制的方法
2015/04/17 PHP
PHP生成plist数据的方法
2015/06/16 PHP
PHP中header函数的用法及其注意事项详解
2016/06/13 PHP
将PHP的session数据存储到数据库中的代码实例
2016/06/24 PHP
php使用函数pathinfo()、parse_url()和basename()解析URL
2016/11/25 PHP
phpmailer绑定邮箱的实现方法
2016/12/01 PHP
Laravel框架用户登陆身份验证实现方法详解
2017/09/14 PHP
设置下载不需要倒计时cookie(倒计时代码)
2008/11/19 Javascript
JavaScript DOM 学习第三章 内容表格
2010/02/19 Javascript
javascript简单实现滑动菜单效果的方法
2015/07/27 Javascript
JavaScript生成二维码图片小结
2015/12/27 Javascript
javascript创建对象、对象继承的实用方式详解
2016/03/08 Javascript
javascript读取文本节点方法小结
2016/12/15 Javascript
js 将input框中的输入自动转化成半角大写(税号输入框)
2017/02/16 Javascript
浅谈webpack编译vue项目生成的代码探索
2017/12/11 Javascript
angularJs-$http实现百度搜索时的动态下拉框示例
2018/02/27 Javascript
JavaScript的词法结构精华篇
2018/10/17 Javascript
在小程序Canvas中使用measureText的方法示例
2018/10/19 Javascript
vuex的module模块用法示例
2018/11/12 Javascript
python访问sqlserver示例
2014/02/10 Python
用Python写一段用户登录的程序代码
2018/04/22 Python
python3使用pandas获取股票数据的方法
2018/12/22 Python
Python多进程fork()函数详解
2019/02/22 Python
python图形开发GUI库pyqt5的详细使用方法及各控件的属性与方法
2020/02/14 Python
python递归函数求n的阶乘,优缺点及递归次数设置方式
2020/04/02 Python
前端H5 Video常见使用场景简介
2020/08/21 HTML / CSS
平面设计专业大学生职业规划书
2014/03/12 职场文书
货车司机岗位职责
2014/03/18 职场文书
财务部副经理岗位职责范本
2014/06/17 职场文书
不遵守课堂纪律的检讨书
2014/09/24 职场文书
无子女夫妻离婚协议书(4篇)
2014/10/20 职场文书
工地材料员岗位职责
2015/04/11 职场文书
浅谈Redis跟MySQL的双写问题解决方案
2022/02/24 Redis