python 中文字符串的处理实现代码


Posted in Python onOctober 25, 2009

>>> teststr = '我的eclipse不能正确的解码gbk码!'
>>> teststr
'\xe6\x88\x91\xe7\x9a\x84eclipse\xe4\xb8\x8d\xe8\x83\xbd\xe6\xad\xa3\xe7\xa1\xae\xe7\x9a\x84\xe8\xa7\xa3\xe7\xa0\x81gbk\xe7\xa0\x81\xef\xbc\x81'
>>> tests2 = u'我的eclipse不能正确的解码gbk码!'
>>> test3 = tests2.encode('gb2312')
>>> test3
'\xce\xd2\xb5\xc4eclipse\xb2\xbb\xc4\xdc\xd5\xfd\xc8\xb7\xb5\xc4\xbd\xe2\xc2\xebgbk\xc2\xeb\xa3\xa1'
>>> test3
'\xce\xd2\xb5\xc4eclipse\xb2\xbb\xc4\xdc\xd5\xfd\xc8\xb7\xb5\xc4\xbd\xe2\xc2\xebgbk\xc2\xeb\xa3\xa1'
>>> teststr
'\xe6\x88\x91\xe7\x9a\x84eclipse\xe4\xb8\x8d\xe8\x83\xbd\xe6\xad\xa3\xe7\xa1\xae\xe7\x9a\x84\xe8\xa7\xa3\xe7\xa0\x81gbk\xe7\xa0\x81\xef\xbc\x81'
>>> test3.decode('gb2312').encode('utf-8')
'\xe6\x88\x91\xe7\x9a\x84eclipse\xe4\xb8\x8d\xe8\x83\xbd\xe6\xad\xa3\xe7\xa1\xae\xe7\x9a\x84\xe8\xa7\xa3\xe7\xa0\x81gbk\xe7\xa0\x81\xef\xbc\x81'
>>> test3.decode('gb2312').encode('utf-8') == teststr
True
如上所见,test3变量(gb2312编码)经过解码(变成unicode字符串)后再使用utf-8编码,就成了与teststr值相同的串了.

通过上面的例子我们也发现,unicode字符串是gb2312字符串(windows就使用这种格式)与utf-8字符串(python本身使用)之间的一座桥梁.

Python 相关文章推荐
python实现html转ubb代码(html2ubb)
Jul 03 Python
python基础教程之对象和类的实际运用
Aug 29 Python
详解python发送各类邮件的主要方法
Dec 22 Python
理解Python中的绝对路径和相对路径
Aug 30 Python
python实现Adapter模式实例代码
Feb 09 Python
Django模型序列化返回自然主键值示例代码
Jun 12 Python
python爬虫实现爬取同一个网站的多页数据的实例讲解
Jan 18 Python
python使用numpy中的size()函数实例用法详解
Jan 29 Python
python制作图形界面的2048游戏, 基于tkinter
Apr 06 Python
matplotlib之pyplot模块实现添加子图subplot的使用
Apr 25 Python
pytorch 实现变分自动编码器的操作
May 24 Python
pandas中DataFrame重置索引的几种方法
May 24 Python
动态创建类实例代码
Oct 07 #Python
Python 文件操作实现代码
Oct 07 #Python
Python 第一步 hello world
Sep 25 #Python
Python 字符串定义
Sep 25 #Python
Python 流程控制实例代码
Sep 25 #Python
Cython 三分钟入门教程
Sep 17 #Python
phpsir 开发 一个检测百度关键字网站排名的python 程序
Sep 17 #Python
You might like
php防注入,表单提交值转义的实现详解
2013/06/10 PHP
四个PHP非常实用的功能
2015/09/29 PHP
WordPress开发中的get_post_custom()函数使用解析
2016/01/04 PHP
php使用ffmpeg向视频中添加文字字幕的实现方法
2016/05/23 PHP
thinkphp下MySQL数据库读写分离代码剖析
2017/04/18 PHP
laravel 获取当前url的别名方法
2019/10/11 PHP
DHTML Slide Show script图片轮换
2008/03/03 Javascript
JS获取父节点方法
2009/08/20 Javascript
JQuery中的ready函数冲突的解决方法
2010/05/17 Javascript
在javaScript中关于submit和button的区别介绍
2013/10/20 Javascript
JavaScript实现列表分页功能特效
2015/05/15 Javascript
jQuery实现仿腾讯迷你首页选项卡效果代码
2015/09/17 Javascript
jquery实现邮箱自动填充提示功能
2015/11/17 Javascript
IntersectionObserver API 详解篇
2016/12/11 Javascript
微信小程序 弹框和模态框实现代码
2017/03/10 Javascript
javascript作用域链与执行环境详解
2017/03/25 Javascript
JavaScript基于replace+正则实现ES6的字符串模版功能
2017/04/25 Javascript
vue.js打包之后可能会遇到的坑!
2018/06/03 Javascript
Postman的下载及安装教程详解
2018/10/16 Javascript
el-select 下拉框多选实现全选的实现
2019/08/02 Javascript
JS中封装axios来管控api的2种方式
2019/09/11 Javascript
JS数组方法reverse()用法实例分析
2020/01/18 Javascript
vue+iview实现分页及查询功能
2020/11/17 Vue.js
python服务器端收发请求的实现代码
2014/09/29 Python
python基于物品协同过滤算法实现代码
2018/05/31 Python
使用Python Pandas处理亿级数据的方法
2019/06/24 Python
Python离线安装各种库及pip的方法
2020/11/28 Python
纯CSS3实现Material Design效果
2017/03/09 HTML / CSS
One.com挪威:北欧成长最快的网络托管公司
2016/11/19 全球购物
北京某科技有限公司C# .net笔试题
2014/09/27 面试题
医药营销个人求职信范文
2014/02/07 职场文书
森林防火标语
2014/06/23 职场文书
校外活动方案
2014/08/28 职场文书
在Django中使用MQTT的方法
2021/05/10 Python
python实现手机推送 代码也就10行左右
2022/04/12 Python
Android开发手册自定义Switch开关按钮控件
2022/06/10 Java/Android