Python2.x和3.x下maketrans与translate函数使用上的不同


Posted in Python onApril 13, 2015

maketrans和translate函数是进行字符串字符编码的常用方法。本文着重点在于演示其基本用法和在不同版本下操作的差异。本文提到的2.X版本指2.6以上的版本,3.X版本指3.1以上的版本。
    2.X版本把字符串基本分为两种:unicode字符串和8位字符串str,后者包含字节数据和我们常见的ASCII码数据;而3.X版本则重新对字符串进行了划分,分为了字节字符串bytes和文本字符串str,两者都是不可变的,所以添加了一个可变的字节字符串类型bytearray。
     2.X版本中string类型和str、unicode类型大量方法是重复的,所以3.X版本不提倡使用string模块中与str重复的方法。string模块中还有很多有用的常量和方法,比如string.digits,可以在字符串编码中方便地使用。

     2.X中maketrans和translate函数的签名:

string.maketrans(from, to)

  string.translate(s, table[, deletechars])
  str.translate(table[, deletechars])
  unicode.translate(table)

    3.X中maketrans和translate函数的签名:

static str.maketrans(x[, y[, z]])
  static bytes.maketrans(from, to)
  static bytearray.maketrans(from, to)

  str.translate(map)
  bytes.translate(table[, delete])
  bytearray.translate(table[, delete])

    从中可以看出,相对于2.X的string模块的maketrans方法,3.X中分别提供了三个静态方法用于创建映射表。
   下面让我们看一个简单的例子来说明字符串转换的过程:
    2.X下的演示过程:

>>> import string                     #导入string模块
  >>> map = string.maketrans('123', 'abc') #建立映射表,将字符串中含有的'1','2','3'替换为'a','b','c'
  >>> s = '54321123789'                #转换前的字符串
  >>> s.translate(map)                  #用创建的映射表map转换字符串
  '54cbaabc789'                        #转换后的字符串

    3.X下的演示过程:

>>> map = str.maketrans('123','abc')
  >>> s = '54321123789'
  >>> s.translate(map)
  '54cbaabc789'

    2.X使用了string的maketrans函数,而3.X使用了str的maketrans函数,除了这一点,使用方法是基本相同的。若指定字符串中要删除的字符时,使用就会略有不同,如下:
    2.X下的演示过程:

>>> import string
  >>> map = string.maketrans('123', 'abc')
  >>> s = '54321123789'
  >>> s.translate(map, '78')        #除了转换,还要删除字符串中的字符'7','8'
  '54cbaabc9'               #转换后的字符串没有字符'7','8'

    3.X下的演示过程:

>>> map = str.maketrans('123','abc', '78')#要删除的字符需要在这指定
  >>> s = '54321123789'
  >>> s.translate(map)
  '54cbaabc9'

    我在读《Python Cookbook》遇到了一个基于2.X版本的例子,如下

import string
  def translator(frm='', to='', delete='', keep=None):
    if len(to) == 1:
      to = to * len(frm)
    trans = string.maketrans(frm, to)
    if keep is not None:
      allchars = string.maketrans('', '')
      delete = allchars.translate(allchars, keep.translate(allchars,delete))
    def translate(s):
      return s.translate(trans, delete)
    return translate

    allchars应该是一个返回的映射表,为什么还可以调用translate方法,所以它应该是一个str类型,测试如下:

>>> import string
  >>> map = string.maketrans('123', 'abc')
  >>> type(map)
  <type 'str'>

    在3.X版本中这个方法不能正常通过运行,那么错在什么地方呢,我们看看映射表是什么类型:

>>> map = str.maketrans('123','abc')
  >>> type(map)
  <class 'dict'>

    知道了映射表的类型了,我们就可以对其进行“后期加工”,像上面《Python Cookbook》中的例子一样,来满足我们的编码要求。

   上面讨论的例子用的字符串是ASCII字符组成的,如果是字节类型,2.X版本中操作是一样的,3.X中调用bytes或bytearray的函数;若是unicode类型的,2.X需要用unicode的translate方法,注意下面的代码

 

>>> print u"hallo".translate({97:u'e'})
  hello
  >>> print u"hallo".translate({'a':u'e'})
  hallo
  >>> print u"hallo".translate({u'a':u'e'})
  hallo

    结果之所以不一样,查阅手册可知unicode的translate方法的映射表也就是字典的键必须是unicode的位序数,值可以是unicode的位序数、unicode字符串或这None。

Python 相关文章推荐
跟老齐学Python之有点简约的元组
Sep 24 Python
Python NumPy库安装使用笔记
May 18 Python
Python函数式编程指南(二):从函数开始
Jun 24 Python
浅谈tensorflow中几个随机函数的用法
Jul 27 Python
python中join()方法介绍
Oct 11 Python
在python中利用KNN实现对iris进行分类的方法
Dec 11 Python
python3读取图片并灰度化图片的四种方法(OpenCV、PIL.Image、TensorFlow方法)总结
Jul 04 Python
详解mac python+selenium+Chrome 简单案例
Nov 08 Python
TensorFlow获取加载模型中的全部张量名称代码
Feb 11 Python
Pyqt5 关于流式布局和滚动条的综合使用示例代码
Mar 24 Python
Python爬虫爬取微信朋友圈
Aug 06 Python
python 三种方法实现对Excel表格的读写
Nov 19 Python
使用Pyrex来扩展和加速Python程序的教程
Apr 13 #Python
在Python中使用itertools模块中的组合函数的教程
Apr 13 #Python
Python中用Spark模块的使用教程
Apr 13 #Python
简单理解Python中基于生成器的状态机
Apr 13 #Python
Python中的高级函数map/reduce使用实例
Apr 13 #Python
Python遍历目录的4种方法实例介绍
Apr 13 #Python
用Python生成器实现微线程编程的教程
Apr 13 #Python
You might like
3
2006/10/09 PHP
PHP包含文件函数include、include_once、require、require_once区别总结
2014/04/05 PHP
php判断邮箱地址是否存在的方法
2016/02/13 PHP
CakePHP框架Model关联对象用法分析
2017/08/04 PHP
PHP解决高并发的优化方案实例
2020/12/10 PHP
onpropertypchange
2006/07/01 Javascript
List the Stored Procedures in a SQL Server database
2007/06/20 Javascript
JavaScript 创建运动框架的实现代码
2013/05/08 Javascript
jQuery动态地获取系统时间实现代码
2013/05/24 Javascript
jQuery中RadioButtonList的功能及用法实例介绍
2013/08/23 Javascript
javascript函数作用域学习示例(js作用域)
2014/01/13 Javascript
JavaScript实现随机替换图片的方法
2015/04/16 Javascript
js使用cookie记录用户名的方法
2015/11/26 Javascript
网页挂马方式整理及详细介绍
2016/11/03 Javascript
JavaScript之WebSocket技术详解
2016/11/18 Javascript
Angular 5.0 来了! 有这些大变化
2017/11/15 Javascript
JS实现点击生成UUID的方法完整实例【基于jQuery】
2019/06/12 jQuery
微信小程序防止多次点击跳转(函数节流)
2019/09/19 Javascript
vue.js实现h5机器人聊天(测试版)
2020/07/16 Javascript
[03:16]DOTA2完美大师赛小组赛精彩集锦
2017/11/22 DOTA
[10:18]2018DOTA2国际邀请赛寻真——Fnatic能否笑到最后?
2018/08/14 DOTA
[57:47]Fnatic vs Winstrike 2018国际邀请赛小组赛BO2 第二场 8.18
2018/08/19 DOTA
Python的re模块正则表达式操作
2016/05/25 Python
名片管理系统python版
2018/01/11 Python
深入浅析python3中的unicode和bytes问题
2019/07/03 Python
Python实现制度转换(货币,温度,长度)
2019/07/14 Python
在python3中实现查找数组中最接近与某值的元素操作
2020/02/29 Python
谈一谈HTML5本地存储技术
2016/03/02 HTML / CSS
加拿大品牌鞋包连锁店:Little Burgundy
2021/02/28 全球购物
东方通信股份有限公司VC面试题
2014/08/27 面试题
介绍一下gcc特性
2012/01/20 面试题
英文版银行求职信
2013/10/09 职场文书
市场营销个人求职信范文
2014/02/02 职场文书
智慧人生:永远不需要向任何人解释你自己
2019/08/20 职场文书
导游词之无锡东林书院
2019/12/11 职场文书
python自动获取微信公众号最新文章的实现代码
2022/07/15 Python