python 中文字符串的处理实现代码


Posted in Python onOctober 25, 2009

>>> teststr = '我的eclipse不能正确的解码gbk码!'
>>> teststr
'\xe6\x88\x91\xe7\x9a\x84eclipse\xe4\xb8\x8d\xe8\x83\xbd\xe6\xad\xa3\xe7\xa1\xae\xe7\x9a\x84\xe8\xa7\xa3\xe7\xa0\x81gbk\xe7\xa0\x81\xef\xbc\x81'
>>> tests2 = u'我的eclipse不能正确的解码gbk码!'
>>> test3 = tests2.encode('gb2312')
>>> test3
'\xce\xd2\xb5\xc4eclipse\xb2\xbb\xc4\xdc\xd5\xfd\xc8\xb7\xb5\xc4\xbd\xe2\xc2\xebgbk\xc2\xeb\xa3\xa1'
>>> test3
'\xce\xd2\xb5\xc4eclipse\xb2\xbb\xc4\xdc\xd5\xfd\xc8\xb7\xb5\xc4\xbd\xe2\xc2\xebgbk\xc2\xeb\xa3\xa1'
>>> teststr
'\xe6\x88\x91\xe7\x9a\x84eclipse\xe4\xb8\x8d\xe8\x83\xbd\xe6\xad\xa3\xe7\xa1\xae\xe7\x9a\x84\xe8\xa7\xa3\xe7\xa0\x81gbk\xe7\xa0\x81\xef\xbc\x81'
>>> test3.decode('gb2312').encode('utf-8')
'\xe6\x88\x91\xe7\x9a\x84eclipse\xe4\xb8\x8d\xe8\x83\xbd\xe6\xad\xa3\xe7\xa1\xae\xe7\x9a\x84\xe8\xa7\xa3\xe7\xa0\x81gbk\xe7\xa0\x81\xef\xbc\x81'
>>> test3.decode('gb2312').encode('utf-8') == teststr
True
如上所见,test3变量(gb2312编码)经过解码(变成unicode字符串)后再使用utf-8编码,就成了与teststr值相同的串了.

通过上面的例子我们也发现,unicode字符串是gb2312字符串(windows就使用这种格式)与utf-8字符串(python本身使用)之间的一座桥梁.

Python 相关文章推荐
用Python编写web API的教程
Apr 30 Python
在Python的Django框架中创建语言文件
Jul 27 Python
用yum安装MySQLdb模块的步骤方法
Dec 15 Python
numpy自动生成数组详解
Dec 15 Python
Python中对数组集进行按行打乱shuffle的方法
Nov 08 Python
Django框架会话技术实例分析【Cookie与Session】
May 24 Python
Python实用库 PrettyTable 学习笔记
Aug 06 Python
pytorch 获取层权重,对特定层注入hook, 提取中间层输出的方法
Aug 17 Python
opencv-python 提取sift特征并匹配的实例
Dec 09 Python
python计算波峰波谷值的方法(极值点)
Feb 18 Python
用python发送微信消息
Dec 21 Python
详解Python类和对象内容
Jun 22 Python
动态创建类实例代码
Oct 07 #Python
Python 文件操作实现代码
Oct 07 #Python
Python 第一步 hello world
Sep 25 #Python
Python 字符串定义
Sep 25 #Python
Python 流程控制实例代码
Sep 25 #Python
Cython 三分钟入门教程
Sep 17 #Python
phpsir 开发 一个检测百度关键字网站排名的python 程序
Sep 17 #Python
You might like
PHP中开发XML应用程序之基础篇 添加节点 删除节点 查询节点 查询节
2010/07/09 PHP
php中定时计划任务的实现原理
2013/01/08 PHP
php基于curl扩展制作跨平台的restfule 接口
2015/05/11 PHP
php官方微信接口大全(微信支付、微信红包、微信摇一摇、微信小店)
2015/12/21 PHP
Jquery 数据选择插件Pickerbox使用介绍
2012/08/24 Javascript
jquery 实现checkbox全选,反选,全不选等功能代码(奇数)
2012/10/24 Javascript
JavaScript起点(严格模式深度了解)
2013/01/28 Javascript
js统计录入文本框中字符的个数并加以限制不超过多少
2014/05/23 Javascript
javascript中clone对象详解
2014/12/03 Javascript
Js实现简单的小球运动特效
2016/02/18 Javascript
Node.js设置CORS跨域请求中多域名白名单的方法
2017/03/28 Javascript
jQuery实现简单的回到顶部totop功能示例
2017/10/16 jQuery
Vue实现PopupWindow组件详解
2018/04/28 Javascript
JavaScript原型对象、构造函数和实例对象功能与用法详解
2018/08/04 Javascript
微信小程序滑动选择器的实现代码
2018/08/10 Javascript
python client使用http post 到server端的代码
2013/02/10 Python
Python获取当前时间的方法
2014/01/14 Python
Python中的CURL PycURL使用例子
2014/06/01 Python
Python实现的数据结构与算法之队列详解
2015/04/22 Python
Python中Proxypool库的安装与配置
2018/10/19 Python
Python简单获取二维数组行列数的方法示例
2018/12/21 Python
Python3.5基础之函数的定义与使用实例详解【参数、作用域、递归、重载等】
2019/04/26 Python
详解Python3 对象组合zip()和回退方式*zip
2019/05/15 Python
Pytorch 实现冻结指定卷积层的参数
2020/01/06 Python
Python暴力破解Mysql数据的示例
2020/11/09 Python
H5 meta小结(前端必看篇)
2016/08/24 HTML / CSS
配置H5的滚动条样式的示例代码
2018/03/09 HTML / CSS
Sasa莎莎海外旗舰店:香港莎莎美妆平台
2018/03/21 全球购物
日本必酷网络直营店:Biccamera
2019/03/23 全球购物
网管求职信
2014/03/03 职场文书
环境保护标语
2014/06/20 职场文书
2014年客户经理工作总结
2014/11/20 职场文书
新娘婚礼答谢词
2015/09/29 职场文书
用Python爬取英雄联盟的皮肤详细示例
2021/12/06 Python
Python 装饰器(decorator)常用的创建方式及解析
2022/04/24 Python
安装harbor作为docker镜像仓库的问题
2022/06/14 Servers