python去掉 unicode 字符串前面的u方法


Posted in Python onOctober 21, 2018

有时我们会碰到类似下面这样的 unicode 字符串:

u'\xe4\xbd\xa0\xe5\xa5\xbd'

这明显不是一个正确的 unicode 字符串,可能是在哪个地方转码转错了。

我们要想得到正确的 unicode 字符串首先就必须先将这个字符串转成非 unicode 字符串, 然后再进行解码。按照普通的办法进行 encode 肯定是不行的,因为这不是一个正确的 unicode 字符串:

In [1]: u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('utf8')
Out[1]: '\xc3\xa4\xc2\xbd\xc2\xa0\xc3\xa5\xc2\xa5\xc2\xbd'

In [2]: print u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('utf8')
盲陆?氓楼陆
那如何才能得到我们想要的 \xe4\xbd\xa0\xe5\xa5\xbd 呢?

python 提供了一个特殊的编码( raw_unicode_escape )用来处理这种情况:

In [4]: u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('raw_unicode_escape')
Out[4]: '\xe4\xbd\xa0\xe5\xa5\xbd'

In [5]: u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('raw_unicode_escape').decode('utf8')
Out[5]: u'\u4f60\u597d'

In [7]: print u'\u4f60\u597d'
你好

以上这篇python去掉 unicode 字符串前面的u方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中实现字符串类型与字典类型相互转换的方法
Aug 18 Python
Python中elasticsearch插入和更新数据的实现方法
Apr 01 Python
python中ASCII码和字符的转换方法
Jul 09 Python
Python使用Selenium模块实现模拟浏览器抓取淘宝商品美食信息功能示例
Jul 18 Python
Python中使用logging和traceback模块记录日志和跟踪异常
Apr 09 Python
使用python分析统计自己微信朋友的信息
Jul 19 Python
用python实现英文字母和相应序数转换的方法
Sep 18 Python
Python利用全连接神经网络求解MNIST问题详解
Jan 14 Python
Python列表操作方法详解
Feb 09 Python
python学习将数据写入文件并保存方法
Jun 07 Python
Python3使用tesserocr识别字母数字验证码的实现
Jan 29 Python
Pytorch之扩充tensor的操作
Mar 04 Python
python 分离文件名和路径以及分离文件名和后缀的方法
Oct 21 #Python
python之消除前缀重命名的方法
Oct 21 #Python
使用Scrapy爬取动态数据
Oct 21 #Python
python使用正则表达式来获取文件名的前缀方法
Oct 21 #Python
python遍历文件夹找出文件夹后缀为py的文件方法
Oct 21 #Python
python os.listdir按文件存取时间顺序列出目录的实例
Oct 21 #Python
python查找指定文件夹下所有文件并按修改时间倒序排列的方法
Oct 21 #Python
You might like
php中计算程序运行时间的类代码
2012/11/03 PHP
PHP中key和current,next的联合运用实例分析
2016/03/29 PHP
PHP数组函数知识汇总
2016/05/12 PHP
PHP 5.6.11 访问SQL Server2008R2的几种情况详解
2016/08/08 PHP
php使用函数pathinfo()、parse_url()和basename()解析URL
2016/11/25 PHP
PHP面向对象继承用法详解(优化与减少代码重复)
2016/12/02 PHP
浅析PHP中的闭包和匿名函数
2017/12/25 PHP
Mootools 1.2教程 正则表达式
2009/09/15 Javascript
跨浏览器通用、可重用的选项卡tab切换js代码
2011/09/20 Javascript
JS正则表达式大全(整理详细且实用)
2013/11/14 Javascript
禁用JavaScript控制台调试的方法
2014/03/07 Javascript
node.js中的fs.readSync方法使用说明
2014/12/17 Javascript
Eclipse配置Javascript开发环境图文教程
2015/01/29 Javascript
JavaScript Function函数类型介绍
2015/04/08 Javascript
js倒计时抢购实例
2015/12/20 Javascript
jQuery实现根据滚动条位置加载相应内容功能
2016/07/18 Javascript
JavaScript基于对象去除数组重复项的方法
2016/10/09 Javascript
JQuery实现图片轮播效果
2017/05/08 jQuery
vue 数组和对象不能直接赋值情况和解决方法(推荐)
2017/10/25 Javascript
在vue项目中,将juery设置为全局变量的方法
2018/09/25 Javascript
element-ui 本地化使用教程详解
2019/10/28 Javascript
微信小程序云函数添加数据到数据库的方法
2020/03/04 Javascript
Vue执行方法,方法获取data值,设置data值,方法传值操作
2020/08/05 Javascript
微信小程序实现底部弹出模态框
2020/11/18 Javascript
[02:35]DOTA2英雄基础教程 狙击手
2014/01/14 DOTA
python自动zip压缩目录的方法
2015/06/28 Python
python实现全盘扫描搜索功能的方法
2019/02/14 Python
python实现画循环圆
2019/11/23 Python
keras多显卡训练方式
2020/06/10 Python
解决H5的a标签的download属性下载service上的文件出现跨域问题
2019/07/16 HTML / CSS
汉语言文学专业求职信
2014/06/19 职场文书
学校机关党总支领导班子整改工作方案
2014/10/26 职场文书
营业员岗位职责范本
2015/04/14 职场文书
谢师宴学生答谢词
2015/09/30 职场文书
《遗弃》开发商删推文要跑路?官方回应:还在开发
2022/04/03 其他游戏
GoFrame框架数据校验之校验结果Error接口对象
2022/06/21 Golang