python去掉 unicode 字符串前面的u方法


Posted in Python onOctober 21, 2018

有时我们会碰到类似下面这样的 unicode 字符串:

u'\xe4\xbd\xa0\xe5\xa5\xbd'

这明显不是一个正确的 unicode 字符串,可能是在哪个地方转码转错了。

我们要想得到正确的 unicode 字符串首先就必须先将这个字符串转成非 unicode 字符串, 然后再进行解码。按照普通的办法进行 encode 肯定是不行的,因为这不是一个正确的 unicode 字符串:

In [1]: u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('utf8')
Out[1]: '\xc3\xa4\xc2\xbd\xc2\xa0\xc3\xa5\xc2\xa5\xc2\xbd'

In [2]: print u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('utf8')
盲陆?氓楼陆
那如何才能得到我们想要的 \xe4\xbd\xa0\xe5\xa5\xbd 呢?

python 提供了一个特殊的编码( raw_unicode_escape )用来处理这种情况:

In [4]: u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('raw_unicode_escape')
Out[4]: '\xe4\xbd\xa0\xe5\xa5\xbd'

In [5]: u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('raw_unicode_escape').decode('utf8')
Out[5]: u'\u4f60\u597d'

In [7]: print u'\u4f60\u597d'
你好

以上这篇python去掉 unicode 字符串前面的u方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Windows和Linux下使用Python访问SqlServer的方法介绍
Mar 10 Python
简单介绍Python的Django框架加载模版的方式
Jul 20 Python
Python冒泡排序注意要点实例详解
Sep 09 Python
Python中join函数简单代码示例
Jan 09 Python
Python自定义线程类简单示例
Mar 23 Python
Python应用库大全总结
May 30 Python
python traceback捕获并打印异常的方法
Aug 31 Python
Python求一批字符串的最长公共前缀算法示例
Mar 02 Python
Python基础教程之if判断,while循环,循环嵌套
Apr 25 Python
django框架自定义模板标签(template tag)操作示例
Jun 24 Python
Django数据库操作之save与update的使用
Apr 01 Python
python 利用matplotlib在3D空间中绘制平面的案例
Feb 06 Python
python 分离文件名和路径以及分离文件名和后缀的方法
Oct 21 #Python
python之消除前缀重命名的方法
Oct 21 #Python
使用Scrapy爬取动态数据
Oct 21 #Python
python使用正则表达式来获取文件名的前缀方法
Oct 21 #Python
python遍历文件夹找出文件夹后缀为py的文件方法
Oct 21 #Python
python os.listdir按文件存取时间顺序列出目录的实例
Oct 21 #Python
python查找指定文件夹下所有文件并按修改时间倒序排列的方法
Oct 21 #Python
You might like
php 连接mssql数据库 初学php笔记
2010/03/01 PHP
php类常量的使用详解
2013/06/08 PHP
php查看网页源代码的方法
2015/03/13 PHP
使用PHP如何实现高效安全的ftp服务器(二)
2015/12/30 PHP
php实现的读取CSV文件函数示例
2017/02/07 PHP
DIV菜单层实现代码
2010/11/19 Javascript
jquery插件validate验证的小例子
2013/05/08 Javascript
jquery中文乱码的多种解决方法
2013/06/21 Javascript
鼠标经过显示二级菜单js特效
2013/08/13 Javascript
jquery制作弹窗提示窗口代码分享
2014/03/02 Javascript
将HTML格式的String转化为HTMLElement的实现方法
2014/08/07 Javascript
js获取时间并实现字符串和时间戳之间的转换
2015/01/05 Javascript
js实现漂浮回顶部按钮实例
2015/05/06 Javascript
js实现左侧网页tab滑动门效果代码
2015/09/06 Javascript
基于BootStrap实现局部刷新分页实例代码
2016/08/08 Javascript
chrome浏览器如何断点调试异步加载的JS
2016/09/05 Javascript
JavaScript中三个等号和两个等号的区别(== 和 ===)浅析
2016/09/22 Javascript
PHP7新特性简述
2017/06/11 Javascript
bootstrap daterangepicker汉化以及扩展功能
2017/06/15 Javascript
在ES5与ES6环境下处理函数默认参数的实现方法
2018/05/13 Javascript
[43:47]DOTA2上海特级锦标赛主赛事日 - 4 败者组第四轮#2 MVP.Phx VS Fnatic第一局
2016/03/05 DOTA
Python入门篇之文件
2014/10/20 Python
python实现简单socket程序在两台电脑之间传输消息的方法
2015/03/13 Python
解决pandas 作图无法显示中文的问题
2018/05/24 Python
python DataFrame 取差集实例
2019/01/30 Python
Python实现word2Vec model过程解析
2019/12/16 Python
浅析Python 抽象工厂模式的优缺点
2020/07/13 Python
python绘图模块之利用turtle画图
2021/02/12 Python
css实例教程 一款纯css3实现的超炫动画背画特效
2014/11/05 HTML / CSS
猫途鹰:全球领先的旅游点评社区
2017/04/07 全球购物
印度和世界各地的精美产品:Ikka Dukka
2018/02/12 全球购物
财务方面个人工作的自我评价
2013/12/28 职场文书
纪念九一八事变83周年国旗下讲话稿
2014/09/15 职场文书
保研推荐信格式
2015/03/25 职场文书
工程质检员岗位职责
2015/04/08 职场文书
民事撤诉申请书范本
2015/05/18 职场文书