Python中字符串与编码示例代码


Posted in Python onMay 20, 2019

在最新的Python 3版本中,字符串是以Unicode编码的,即Python的字符串支持多语言

编码和解码

 

字符串在内存中以Unicode表示,在操作字符串时,经常需要str和bytes互相转换
 

如果在网络上传输或保存到磁盘上,则从内存读到的数据就是str,要把str变为以字节为单位的bytes,称为编码
 

如果从网络或磁盘上读取字节流,则从网络或磁盘上读到的数据就是bytes,要把bytes变为str,称为解码
 

为避免乱码问题,应当始终坚持使用UTF-8编码对str和bytes进行转换

使用示例:

单个字符的编码

print(ord('A')) #输出:65,获取字符的整数表示
print(chr(66)) #输出:B,把编码转换为对应的字符

十六进制表示

print('中文') #输出:'中文',
print('\u4e2d\u6587') #输出:'中文','\u4e2d\u6587'和'中文'完全对等,如果知道字符的整数编码,还可以用十六进制这么写str

bytes类型的数据表示

x = b'ABC' #Python对bytes类型的数据用带b前缀的单引号或双引号表示,'ABC'和b'ABC'在显示上完全一样,但bytes的每个字符都只占用一个字节

编码

print('ABC'.encode('ascii')) #输出:b'ABC',以Unicode表示的str通过encode()方法可以编码为指定的bytes
print( '中文'.encode('utf-8')) #输出:b'\xe4\xb8\xad\xe6\x96\x87',
print( '中文'.encode('ascii')) #输出:报错,因为中文字符在ascii编码范围外,所以导致编码失败

解码

print(b'ABC'.decode('ascii')) #输出:'ABC'
print(b'\xe4\xb8\xad\xe6\x96\x87'.decode('ascii')) #输出:'中文'
print(b'\xe4\xb8\xad\xff'.decode('utf-8', errors='ignore')) #输出:'中',如果bytes中只有一小部分无效的字节,可以传入errors='ignore'忽略错误的字节

计算长度

#len(a)函数返回a的长度,如果a是字符串则返回字符数,如果a是字节表示则返回字节数
print(len('中文')) #输出:2,共2个字符
print(len('ABC')) #输出:3,共3个字符
print(len(b'ABC')) #输出:3,共是3个字节
print(len(b'\xe4\xb8\xad\xe6\x96\x87')) #输出:6,共是6个字节
print(len('中文'.encode('utf-8'))) #输出:6, 1个中文字符经过UTF-8编码后通常会占用3个字节,因此两个汉字的字节数是6

源码文件开头与编码

#!/usr/bin/env python3    告诉Linux/OS X系统,这是一个Python可执行程序,Windows系统会忽略这个注释
# -*- coding: utf-8 -*-   告诉Python解释器,按照UTF-8编码读取源代码,否则在源代码中写的中文输出可能会有乱码

#注意:告诉编译器使用UTF-8编码并不意味着.py文件就是UTF-8编码的,必须并且要确保.py文件用UTF-8 without BOM编码保存,才可确保文件中的中文正常显示

总结

以上所述是小编给大家介绍的Python中字符串与编码示例代码,希望对大家有所帮助,如果大家有任何疑问欢迎给我留言,小编会及时回复大家的!

Python 相关文章推荐
python内存管理分析
Apr 08 Python
python检查序列seq是否含有aset中项的方法
Jun 30 Python
浅谈Python脚本开头及导包注释自动添加方法
Oct 27 Python
PyQt5 QTableView设置某一列不可编辑的方法
Jun 25 Python
Python-Seaborn热图绘制的实现方法
Jul 15 Python
pycharm配置git(图文教程)
Aug 16 Python
wxpython绘制圆角窗体
Nov 18 Python
浅谈Pycharm最有必要改的几个默认设置项
Feb 14 Python
Python+OpenCV实现图像的全景拼接
Mar 05 Python
Python字符串split及rsplit方法原理详解
Jun 29 Python
Python如何读取、写入JSON数据
Jul 28 Python
selenium+python自动化78-autoit参数化与批量上传功能的实现
Mar 04 Python
python实现统计文本中单词出现的频率详解
May 20 #Python
详解Python字符串切片
May 20 #Python
Django中ORM外键和表的关系详解
May 20 #Python
利用Django模版生成树状结构实例代码
May 19 #Python
使用Python3内置文档高效学习以及官方中文文档
May 19 #Python
python反编译学习之字节码详解
May 19 #Python
python从入门到精通 windows安装python图文教程
May 18 #Python
You might like
如何使用php判断所处服务器操作系统的类型
2013/06/20 PHP
Windows7下的php环境配置教程
2015/02/28 PHP
24条货真价实的PHP代码优化技巧
2016/07/28 PHP
获取元素距离浏览器周边的位置的方法getBoundingClientRect
2013/04/17 Javascript
javascript窗口宽高,鼠标位置,滚动高度(详细解析)
2013/11/18 Javascript
jqplot通过ajax动态画折线图的方法及思路
2013/12/08 Javascript
js模仿hover的具体实现代码
2013/12/30 Javascript
js获取通过ajax返回的map型的JSONArray的方法
2014/01/09 Javascript
javascript:window.open弹出窗口的位置问题
2014/03/18 Javascript
两种方法基于jQuery实现IE浏览器兼容placeholder效果
2014/10/14 Javascript
浅谈JavaScript中Date(日期对象),Math对象
2015/02/05 Javascript
JavaScript 性能优化小结
2015/10/12 Javascript
javascript编程异常处理实例小结
2015/11/30 Javascript
微信小程序开发之麦克风动画 帧动画 放大 淡出
2017/04/18 Javascript
微信小程序实现红包功能(后端PHP实现逻辑)
2018/07/11 Javascript
详解Vue开发微信H5微信分享签名失败问题解决方案
2018/08/09 Javascript
vue-cli 2.*中导入公共less文件的方法步骤
2018/11/22 Javascript
浅谈Vue 性能优化之深挖数组
2018/12/11 Javascript
解决layui数据表格table的横向滚动条显示问题
2019/09/04 Javascript
python的描述符(descriptor)、装饰器(property)造成的一个无限递归问题分享
2014/07/09 Python
python列表操作实例
2015/01/14 Python
Python中在for循环中嵌套使用if和else语句的技巧
2016/06/20 Python
基于Python数据可视化利器Matplotlib,绘图入门篇,Pyplot详解
2017/10/13 Python
Python warning警告出现的原因及忽略方法
2020/01/31 Python
pytorch使用tensorboardX进行loss可视化实例
2020/02/24 Python
jupyter notebook中新建cell的方法与快捷键操作
2020/04/22 Python
tensorflow dataset.shuffle、dataset.batch、dataset.repeat顺序区别详解
2020/06/03 Python
解决python运行效率不高的问题
2020/07/20 Python
python把一个字符串切开的实例方法
2020/09/27 Python
Peter Alexander新西兰站:澳大利亚领先的睡衣设计师品牌
2016/12/10 全球购物
自荐书范文
2013/12/08 职场文书
电大毕业个人生自我鉴定
2014/03/26 职场文书
活动总结结尾怎么写
2014/08/30 职场文书
婚前财产协议书范本
2014/10/19 职场文书
拔河比赛新闻稿
2015/07/17 职场文书
JavaScript架构localStorage特殊场景下二次封装操作
2022/06/21 Javascript