python 中文字符串的处理实现代码


Posted in Python onOctober 25, 2009

>>> teststr = '我的eclipse不能正确的解码gbk码!'
>>> teststr
'\xe6\x88\x91\xe7\x9a\x84eclipse\xe4\xb8\x8d\xe8\x83\xbd\xe6\xad\xa3\xe7\xa1\xae\xe7\x9a\x84\xe8\xa7\xa3\xe7\xa0\x81gbk\xe7\xa0\x81\xef\xbc\x81'
>>> tests2 = u'我的eclipse不能正确的解码gbk码!'
>>> test3 = tests2.encode('gb2312')
>>> test3
'\xce\xd2\xb5\xc4eclipse\xb2\xbb\xc4\xdc\xd5\xfd\xc8\xb7\xb5\xc4\xbd\xe2\xc2\xebgbk\xc2\xeb\xa3\xa1'
>>> test3
'\xce\xd2\xb5\xc4eclipse\xb2\xbb\xc4\xdc\xd5\xfd\xc8\xb7\xb5\xc4\xbd\xe2\xc2\xebgbk\xc2\xeb\xa3\xa1'
>>> teststr
'\xe6\x88\x91\xe7\x9a\x84eclipse\xe4\xb8\x8d\xe8\x83\xbd\xe6\xad\xa3\xe7\xa1\xae\xe7\x9a\x84\xe8\xa7\xa3\xe7\xa0\x81gbk\xe7\xa0\x81\xef\xbc\x81'
>>> test3.decode('gb2312').encode('utf-8')
'\xe6\x88\x91\xe7\x9a\x84eclipse\xe4\xb8\x8d\xe8\x83\xbd\xe6\xad\xa3\xe7\xa1\xae\xe7\x9a\x84\xe8\xa7\xa3\xe7\xa0\x81gbk\xe7\xa0\x81\xef\xbc\x81'
>>> test3.decode('gb2312').encode('utf-8') == teststr
True
如上所见,test3变量(gb2312编码)经过解码(变成unicode字符串)后再使用utf-8编码,就成了与teststr值相同的串了.

通过上面的例子我们也发现,unicode字符串是gb2312字符串(windows就使用这种格式)与utf-8字符串(python本身使用)之间的一座桥梁.

Python 相关文章推荐
Python中声明只包含一个元素的元组数据方法
Aug 25 Python
用Python编写一个简单的FUSE文件系统的教程
Apr 02 Python
Python实现给文件添加内容及得到文件信息的方法
May 28 Python
Ruby元编程基础学习笔记整理
Jul 02 Python
Python模拟随机游走图形效果示例
Feb 06 Python
[原创]Python入门教程5. 字典基本操作【定义、运算、常用函数】
Nov 01 Python
Python实现定期检查源目录与备份目录的差异并进行备份功能示例
Feb 27 Python
python三大神器之fabric使用教程
Jun 10 Python
Django后端接收嵌套Json数据及解析详解
Jul 17 Python
Pytorch根据layers的name冻结训练方式
Jan 06 Python
浅谈tensorflow中Dataset图片的批量读取及维度的操作详解
Jan 20 Python
python matplotlib 绘图 和 dpi对应关系详解
Mar 14 Python
动态创建类实例代码
Oct 07 #Python
Python 文件操作实现代码
Oct 07 #Python
Python 第一步 hello world
Sep 25 #Python
Python 字符串定义
Sep 25 #Python
Python 流程控制实例代码
Sep 25 #Python
Cython 三分钟入门教程
Sep 17 #Python
phpsir 开发 一个检测百度关键字网站排名的python 程序
Sep 17 #Python
You might like
玩家交还《星际争霸》原始码光盘 暴雪报以厚礼
2017/05/05 星际争霸
由php的call_user_func传reference引发的思考
2010/07/23 PHP
php摘要生成函数(无乱码)
2012/02/04 PHP
PDO防注入原理分析以及使用PDO的注意事项总结
2014/10/23 PHP
几个实用的PHP内置函数使用指南
2014/11/27 PHP
php简单日历函数
2015/10/28 PHP
详解Yii2.0 rules验证规则集合
2017/03/21 PHP
laravel项目利用twemproxy部署redis集群的完整步骤
2018/05/11 PHP
Mootools 1.2教程 同时进行多个形变动画
2009/09/15 Javascript
JQuery 插件制作实践 xMarquee插件V1.0
2010/04/02 Javascript
JQuery设置文本框和密码框得到焦点时的样式
2013/08/30 Javascript
浅析XMLHttpRequest的缓存问题
2013/12/13 Javascript
javascript实现简单的分页特效
2015/08/12 Javascript
js手动播放图片实现图片轮播效果
2016/09/17 Javascript
使用JavaScript判断用户输入的是否为正整数(两种方法)
2017/02/05 Javascript
微信小程序 支付功能(前端)的实现
2017/05/24 Javascript
JS实现div模块的截图并下载功能
2017/10/17 Javascript
Vue的轮播图组件实现方法
2018/03/03 Javascript
jquery操作checkbox的常用方法总结【附测试源码下载】
2019/06/10 jQuery
vue项目中常见问题及解决方案(推荐)
2019/10/21 Javascript
vue学习笔记之给组件绑定原生事件操作示例
2020/02/27 Javascript
js实现鼠标点击飘爱心效果
2020/08/19 Javascript
jquery实现广告上下滚动效果
2021/03/04 jQuery
[01:03:31]DOTA2上海特级锦标赛B组资格赛#1 Alliance VS Fnatic第二局
2016/02/26 DOTA
Python 基础教程之包和类的用法
2017/02/23 Python
Python3网络爬虫开发实战之极验滑动验证码的识别
2019/08/02 Python
pandas 中对特征进行硬编码和onehot编码的实现
2019/12/20 Python
linux 下selenium chrome使用详解
2020/04/02 Python
python 利用openpyxl读取Excel表格中指定的行或列教程
2021/02/06 Python
GIVENCHY纪梵希官方旗舰店:高定彩妆与贵族护肤品
2018/04/16 全球购物
2014年预备党员端正入党动机思想汇报
2014/09/13 职场文书
领导干部四风问题自我剖析材料
2014/09/25 职场文书
2014-2015学年工作总结
2014/11/27 职场文书
新学期开学寄语2016
2015/12/04 职场文书
2016年五一促销广告语
2016/01/28 职场文书
JavaScript实现外溢动态爱心的效果的示例代码
2022/03/21 Javascript