python去掉 unicode 字符串前面的u方法


Posted in Python onOctober 21, 2018

有时我们会碰到类似下面这样的 unicode 字符串:

u'\xe4\xbd\xa0\xe5\xa5\xbd'

这明显不是一个正确的 unicode 字符串,可能是在哪个地方转码转错了。

我们要想得到正确的 unicode 字符串首先就必须先将这个字符串转成非 unicode 字符串, 然后再进行解码。按照普通的办法进行 encode 肯定是不行的,因为这不是一个正确的 unicode 字符串:

In [1]: u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('utf8')
Out[1]: '\xc3\xa4\xc2\xbd\xc2\xa0\xc3\xa5\xc2\xa5\xc2\xbd'

In [2]: print u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('utf8')
盲陆?氓楼陆
那如何才能得到我们想要的 \xe4\xbd\xa0\xe5\xa5\xbd 呢?

python 提供了一个特殊的编码( raw_unicode_escape )用来处理这种情况:

In [4]: u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('raw_unicode_escape')
Out[4]: '\xe4\xbd\xa0\xe5\xa5\xbd'

In [5]: u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('raw_unicode_escape').decode('utf8')
Out[5]: u'\u4f60\u597d'

In [7]: print u'\u4f60\u597d'
你好

以上这篇python去掉 unicode 字符串前面的u方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python写的英文字符大小写转换代码示例
Mar 06 Python
Python中的pass语句使用方法讲解
May 14 Python
在Python程序员面试中被问的最多的10道题
Dec 05 Python
获取python文件扩展名和文件名方法
Feb 02 Python
Python DataFrame 设置输出不显示index(索引)值的方法
Jun 07 Python
正确理解Python中if __name__ == '__main__'
Jan 24 Python
Python 通过打码平台实现验证码的实现
May 13 Python
Python 文件操作之读取文件(read),文件指针与写入文件(write),文件打开方式示例
Sep 29 Python
pytorch中的自定义反向传播,求导实例
Jan 06 Python
Python 多线程共享变量的实现示例
Apr 17 Python
Python包和模块的分发详细介绍
Jun 19 Python
Python WSGI 规范简介
Apr 11 Python
python 分离文件名和路径以及分离文件名和后缀的方法
Oct 21 #Python
python之消除前缀重命名的方法
Oct 21 #Python
使用Scrapy爬取动态数据
Oct 21 #Python
python使用正则表达式来获取文件名的前缀方法
Oct 21 #Python
python遍历文件夹找出文件夹后缀为py的文件方法
Oct 21 #Python
python os.listdir按文件存取时间顺序列出目录的实例
Oct 21 #Python
python查找指定文件夹下所有文件并按修改时间倒序排列的方法
Oct 21 #Python
You might like
php项目开发中用到的快速排序算法分析
2016/06/25 PHP
thinkPHP5.0框架应用请求生命周期分析
2017/03/25 PHP
PHP实现批量修改文件名的方法示例
2019/09/18 PHP
用javascript获得地址栏参数的两种方法
2006/11/08 Javascript
异步加载script的代码
2011/01/12 Javascript
IE6下opacity与JQuery的奇妙结合
2013/03/01 Javascript
jQuery中获取Radio元素值的方法
2013/07/02 Javascript
JavaScript中this详解
2015/09/01 Javascript
实例讲解javascript注册事件处理函数
2016/01/09 Javascript
在线引用最新jquery文件的实现方法
2016/08/26 Javascript
Node.js中process模块常用的属性和方法
2016/12/13 Javascript
Bootstrap Table从零开始
2017/06/30 Javascript
Bootstrap弹出框之自定义悬停框标题、内容和样式示例代码
2017/07/11 Javascript
angular.js中解决跨域问题的三种方式
2017/07/12 Javascript
更改BootStrap popover的默认样式及popover简单用法
2018/09/13 Javascript
vue项目持久化存储数据的实现代码
2018/10/01 Javascript
Vue 页面权限控制和登陆验证功能的实例代码
2019/06/20 Javascript
vue实现短信验证码输入框
2020/04/17 Javascript
Vue-cli 移动端布局和动画使用详解
2020/08/10 Javascript
nodejs+koa2 实现模仿springMVC框架
2020/10/21 NodeJs
[11:12]2018DOTA2国际邀请赛寻真——绿色长城OpTic
2018/08/10 DOTA
[52:06]FNATIC vs NIP 2019国际邀请赛小组赛 BO2 第二场 8.16
2019/08/19 DOTA
对numpy中向量式三目运算符详解
2018/10/31 Python
python assert的用处示例详解
2019/04/01 Python
英国儿童设计师服装的领先零售商:Base
2019/03/17 全球购物
教师实习期自我鉴定
2013/10/06 职场文书
国际经济贸易专业推荐信
2013/11/06 职场文书
2014党员民主评议个人总结
2014/09/10 职场文书
初中毕业生自我评价
2015/03/02 职场文书
工作时间调整通知
2015/04/24 职场文书
致接力运动员加油稿
2015/07/21 职场文书
食堂卫生管理制度
2015/08/04 职场文书
如何写好一份优秀的工作总结?
2019/06/21 职场文书
90行Python代码开发个人云盘应用
2021/04/20 Python
Java elasticsearch安装以及部署教程
2021/06/28 Java/Android
解决IIS7下无法绑定https主机的问题
2022/04/29 Servers