五种Python转义表示法


Posted in Python onNovember 27, 2020

1. 为什么要有转义?

ASCII 表中一共有 128 个字符。这里面有我们非常熟悉的字母、数字、标点符号,这些都可以从我们的键盘中输出。除此之外,还有一些非常特殊的字符,这些字符,我通常很难用键盘上的找到,比如制表符、响铃这种。

为了能将那些特殊字符都能写入到字符串变量中,就规定了一个用于转义的字符 \ ,有了这个字符,你在字符串中看的字符,print 出来后就不一定你原来看到的了。

举个例子

>>> msg = "hello\013world\013hello\013python"
>>> print(msg)
hello
   world
     hello
        python
>>>

是不是有点神奇?变成阶梯状的输出了。

那个 \013 又是什么意思呢?

  • \ 是转义符号,上面已经说过
  • 013 是 ASCII 编码的八进制表示,注意前面是 0 且不可省略,而不是字母 o

把八进制的 13 转成 10 进制后是 11

五种Python转义表示法

对照查看 ASCII 码表,11 对应的是一个垂直定位符号,这就能解释,为什么是阶梯状的输出字符串。

五种Python转义表示法

2. 转义的 5 种表示法

ASCII 有 128 个字符,如果用 八进制表示,至少得有三位数,才能将其全部表示。这就是为什么说上面的首位 0 不能省略的原因,即使现在用不上,我也得把它空出来。

而如果使用十六进制,只要两位数就其 ASCII 的字符全部表示出来。同时为了避免和八进制的混淆起来,所以在 \ 后面要加上英文字母 x 表示十六进制,后面再接两位十六进制的数值。

  • \ 开头并接三位 0-7 的数值,表示 8 进制
  • \x 开头并接两位 0-f 的数值,表示 16进制

因此,当我定义一个字符串的值为 hello + 回车 + world 时,就有了多种方法:

# 第一种方法:8进制
>>> msg = "hello\012world"
>>> print(msg)
hello
world
>>> 

# 第二种方法:16 进制
>>> msg = "hello\x0aworld"
>>> print(msg)
hello
world
>>>

通常我们很难记得住一个字符的 ASCII 编号,即使真记住了,也要去转换成八进制或者16进制,实在是太难了。

因此对于一些常用并且比较特殊字符,我们习惯用另一种类似别名的方式,比如使用 \n 表示换行,它与 \012\x0a 是等价的。

与此类似的表示法,还有如下这些

五种Python转义表示法

于是,要实现 hello + 回车 + world ,就有了第三种方法

# 第三种方法:使用类似别名的方法
>>> msg = "hello\nworld"
>>> print(msg)
hello
world
>>>

到目前为止,我们掌握了 三种转义的表示法。

已经非常难得了,让我们的脑洞再大一点吧,接下来再介绍两种。

ASCII 码表所能表示字符实在太有限了,想打印一个中文汉字,抱歉,你得借助 Unicode 码。

Unicode 编码由 4 个16进制数值组合而成

>>> print("\u4E2D")
中

什么?我为什么知道 的 unicode 是 \u4E2D?像下面这样打印就知道啦

# Python 2.7
>>> a = u"中"
>>> a
u'\u4e2d'

由此,要实现 hello + 回车 + world ,就有了第四种方法。

# 第四种方法:使用 unicode ,\u000a 表示换行
>>> print('hello\u000aworld')
hello
world

看到这里,你是不是以为要结束啦?

不,还没有。下面还有一种。

Unicode 编码其实还可以由 8 个32进制数值组合而成,为了以前面的区分开来,这里用 \U 开头。

# 第五种方法:使用 unicode ,\U0000000A 表示换行
>>> print('hello\U0000000Aworld')
hello
world

好啦,目前我们掌握了五种转义的表示法。

总结一下:

  • \ 开头并接三位 0-7 的数值(八进制) — 可以表示所有ASCII 字符
  • \x 开头并接两位 0-f 的数值(十六进制) — 可以表示所有ASCII 字符
  • \u 开头并接四位 0-f 的数值(十六进制) — 可以表示所有 Unicode 字符
  • \U 开头并接八位 0-f 的数值(三十二进制)) — 可以表示所有 Unicode 字符
  • \ 开头后接除 x、u、U 之外的特定字符 — 仅可表示部分字符

为什么标题说,转义也可以炫技呢?

试想一下,假如你的同事,在打印日志时,使用这种 unicode 编码,然后你在定位问题的时候使用这个关键词去搜,却发现什么都搜不到?这就扑街了。

五种Python转义表示法

虽然这种行为真的很 sb,但在某些人看来也许是非常牛逼的操作呢?

五种转义的表示法到这里就介绍完成,接下来是更多转义相关的内容,也是非常有意思的内容,有兴趣的可以继续往下看。

3. raw 字符串

当一个字符串中具有转义的字符时,我们使用 print 打印后,正常情况下,输出的不是我们原来在字符串中看到的那样子。

那如果我们需要输出 hello\nworld ,不希望 Python 将 \n 转义成 换行符呢?

这种情况下,你可以在定义时将字符串定义成 raw 字符串,只要在字符串前面加个 r 或者 R 即可。

>>> print(r"hello\nworld")
hello\nworld
>>> 
>>> print(R"hello\nworld")
hello\nworld

然而,不是所有时候都可以加 r 的,比如当你的字符串是由某个程序/函数返回给你的,而不是你自己生成的

# 假设这个是外来数据,返回 "hello\nworld"
>>> body = spider()
>>> print(body)
hello
world

这个时候打印它,\n 就是换行打印。

4. 使用 repr

对于上面那种无法使用 r 的情况,可以试一下 repr 来解决这个需求:

>>> body = repr(spider())
>>> print(body)
'hello\nworld'

经过 repr 函数的处理后,为让 print 后的结果,接近字符串本身的样子,它实际上做了两件事

  1. \ 变为了 \\
  2. 在字符串的首尾添加 ' 或者 "

你可以在 Python Shell 下敲入 变量 回车,就可以能看出端倪。

首尾是添加 ' 还是 " ,取决于你原字符串。

>>> body="hello\nworld"
>>> repr(body)
"'hello\\nworld'"
>>> 
>>> 
>>> body='hello\nworld'
>>> repr(body)
"'hello\\nworld'"

5. 使用 string_escape

如果你还在使用 Python 2 ,其实还可以使用另一种方法。

那就是使用 string.encode('string_escape') 的方法,它同样可以达到 repr 的效果

>>> "hello\nworld".encode('string_escape')
'hello\\nworld'
>>>

6. 查看原生字符串

综上,想查看原生字符串有两种方法:

  • 如果你在 Python Shell 交互模式下,那么敲击变量回车
  • 如果不在 Python Shell 交互模式下,可先使用 repr 处理一下,再使用 print 打印
>>> body="hello\nworld"
>>> 
>>> body
'hello\nworld'
>>> 
>>> print(repr(body))
'hello\nworld'
>>>

7. 恢复转义:转成原字符串

经过 repr 处理过或者 \\ 取消转义过的字符串,有没有办法再回退出去,变成原先的有转义的字符串呢?

答案是:有。

如果你使用 Python 2,可以这样:

>>> body="hello\\nworld"
>>> 
>>> body
'hello\\nworld'
>>> 
>>> body.decode('string_escape')
'hello\nworld'
>>>

如果你使用 Python 3 ,可以这样:

>>> body="hello\\nworld"
>>> 
>>> body    
'hello\\nworld'
>>> 
>>> bytes(body, "utf-8").decode("unicode_escape")
'hello\nworld'
>>>

什么?还要区分 Python 2 和 Python 3?太麻烦了吧。

明哥教你用一种可以兼容 Python 2 和 Python 3 的写法。

首先是在 Python 2 中的输出

>>> import codecs 
>>> body="hello\\nworld"
>>> 
>>> codecs.decode(body, 'unicode_escape')
u'hello\nworld'
>>>

然后再看看 Python 3 中的输出

>>> import codecs
>>> body="hello\\nworld"
>>> 
>>> codecs.decode(body, 'unicode_escape')
'hello\nworld'
>>>

可以看到 Pyhton 2 中的输出 有一个 u ,而 Python 3 的输出没有了 u,但无论如何 ,他们都取消了转义。

到此这篇关于五种Python转义表示法的文章就介绍到这了,更多相关Python转义内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python实现HTTP协议下的文件下载方法总结
Apr 20 Python
详解Python中使用base64模块来处理base64编码的方法
Jul 01 Python
Python 数据结构之队列的实现
Jan 22 Python
Python进阶-函数默认参数(详解)
May 18 Python
python学生管理系统代码实现
Apr 05 Python
Python迭代器定义与简单用法分析
Apr 30 Python
Python使用folium excel绘制point
Jan 03 Python
python快速编写单行注释多行注释的方法
Jul 31 Python
Python实现滑动平均(Moving Average)的例子
Aug 24 Python
基于python3实现倒叙字符串
Feb 18 Python
python框架flask入门之环境搭建及开启调试
Jun 07 Python
pycharm 添加解释器的方法步骤
Aug 31 Python
Django如何继承AbstractUser扩展字段
Nov 27 #Python
如何使用 Flask 做一个评论系统
Nov 27 #Python
python+openCV对视频进行截取的实现
Nov 27 #Python
Python环境配置实现pip加速过程解析
Nov 27 #Python
python实现学生信息管理系统(精简版)
Nov 27 #Python
基于Python采集爬取微信公众号历史数据
Nov 27 #Python
Django中日期时间型字段进行年月日时分秒分组统计
Nov 27 #Python
You might like
全国FM电台频率大全 - 25 云南省
2020/03/11 无线电
PHP实现邮件群发的源码
2013/06/18 PHP
PHP程序员的技术成长规划
2016/03/25 PHP
详解PHP编码转换函数应用技巧
2016/10/22 PHP
PHP合并数组的2种方法小结
2016/11/24 PHP
Thinkphp事务操作实例(推荐)
2017/04/01 PHP
浅析PHP 中move_uploaded_file 上传中文文件名失败
2019/04/17 PHP
Javascript的IE和Firefox兼容性汇编(zz)
2007/02/02 Javascript
类似CSDN图片切换效果脚本
2009/09/17 Javascript
固定背景实现的背景滚动特效示例分享
2013/05/19 Javascript
ExtJS中设置下拉列表框不可编辑的方法
2014/05/07 Javascript
JS按回车键实现登录的方法
2014/08/25 Javascript
javascript引擎长时间独占线程造成卡顿的解决方案
2014/12/03 Javascript
JS实现双击编辑可修改状态的方法
2015/08/14 Javascript
创建一个类Person的简单实例
2016/05/17 Javascript
angularjs实现的前端分页控件示例
2017/02/10 Javascript
vue双花括号的使用方法 附练习题
2017/11/07 Javascript
vue2.0 实现导航守卫的具体用法(路由守卫)
2018/05/17 Javascript
vue中利用simplemde实现markdown编辑器(增加图片上传功能)
2019/04/29 Javascript
微信小程序动态评分展示/五角星展示/半颗星展示/自定义长度展示功能的实现
2020/07/22 Javascript
[00:52]DOTA2国际邀请赛
2020/02/21 DOTA
几个提升Python运行效率的方法之间的对比
2015/04/03 Python
Python selenium抓取微博内容的示例代码
2018/05/17 Python
Python函数装饰器常见使用方法实例详解
2019/03/30 Python
python里运用私有属性和方法总结
2019/07/08 Python
Python统计时间内的并发数代码实例
2019/12/28 Python
PyCharm无法引用自身项目解决方式
2020/02/12 Python
Python3基于plotly模块保存图片表格
2020/08/03 Python
Python通过递归函数输出嵌套列表元素
2020/10/15 Python
HTML5 新表单类型示例代码
2018/03/20 HTML / CSS
留学生如何写好自荐信
2013/12/27 职场文书
信息管理应届生求职信
2014/03/07 职场文书
小学学习雷锋活动总结
2014/07/03 职场文书
2015年化验室工作总结
2015/04/23 职场文书
货款欠条范本
2015/07/03 职场文书
2016大学生毕业实习心得体会
2016/01/23 职场文书