Python 合并拼接字符串的方法


Posted in Python onJuly 28, 2020

问题

你想将几个小的字符串合并为一个大的字符串

解决方案

如果你想要合并的字符串是在一个序列或者 iterable 中,那么最快的方式就是使用 join() 方法。比如:

>>> parts = ['Is', 'Chicago', 'Not', 'Chicago?']
>>> ' '.join(parts)
'Is Chicago Not Chicago?'
>>> ','.join(parts)
'Is,Chicago,Not,Chicago?'
>>> ''.join(parts)
'IsChicagoNotChicago?'
>>>

初看起来,这种语法看上去会比较怪,但是 join() 被指定为字符串的一个方法。这样做的部分原因是你想去连接的对象可能来自各种不同的数据序列(比如列表,元组,字典,文件,集合或生成器等),如果在所有这些对象上都定义一个 join() 方法明显是冗余的。因此你只需要指定你想要的分割字符串并调用他的 join() 方法去将文本片段组合起来。

如果你仅仅只是合并少数几个字符串,使用加号(+)通常已经足够了:

>>> a = 'Is Chicago'
>>> b = 'Not Chicago?'
>>> a + ' ' + b
'Is Chicago Not Chicago?'
>>>

加号(+)操作符在作为一些复杂字符串格式化的替代方案的时候通常也工作的很好,比如:

>>> print('{} {}'.format(a,b))
Is Chicago Not Chicago?
>>> print(a + ' ' + b)
Is Chicago Not Chicago?
>>>

如果你想在源码中将两个字面字符串合并起来,你只需要简单的将它们放到一起,不需要用加号(+)。比如:

>>> a = 'Hello' 'World'
>>> a
'HelloWorld'
>>>

讨论

字符串合并可能看上去并不需要用一整节来讨论。但是不应该小看这个问题,程序员通常在字符串格式化的时候因为选择不当而给应用程序带来严重性能损失。

最重要的需要引起注意的是,当我们使用加号(+)操作符去连接大量的字符串的时候是非常低效率的,因为加号连接会引起内存复制以及垃圾回收操作。特别的,你永远都不应像下面这样写字符串连接代码:

s = ''
for p in parts:
  s += p

这种写法会比使用 join() 方法运行的要慢一些,因为每一次执行+=操作的时候会创建一个新的字符串对象。你最好是先收集所有的字符串片段然后再将它们连接起来。

一个相对比较聪明的技巧是利用生成器表达式(参考1.19小节)转换数据为字符串的同时合并字符串,比如:

>>> data = ['ACME', 50, 91.1]
>>> ','.join(str(d) for d in data)
'ACME,50,91.1'
>>>

同样还得注意不必要的字符串连接操作。有时候程序员在没有必要做连接操作的时候仍然多此一举。比如在打印的时候:

print(a + ':' + b + ':' + c) # Ugly
print(':'.join([a, b, c])) # Still ugly
print(a, b, c, sep=':') # Better

当混合使用I/O操作和字符串连接操作的时候,有时候需要仔细研究你的程序。比如,考虑下面的两端代码片段:

# Version 1 (string concatenation)
f.write(chunk1 + chunk2)

# Version 2 (separate I/O operations)
f.write(chunk1)
f.write(chunk2)

如果两个字符串很小,那么第一个版本性能会更好些,因为I/O系统调用天生就慢。另外一方面,如果两个字符串很大,那么第二个版本可能会更加高效,因为它避免了创建一个很大的临时结果并且要复制大量的内存块数据。还是那句话,有时候是需要根据你的应用程序特点来决定应该使用哪种方案。

最后谈一下,如果你准备编写构建大量小字符串的输出代码,你最好考虑下使用生成器函数,利用yield语句产生输出片段。比如:

def sample():
  yield 'Is'
  yield 'Chicago'
  yield 'Not'
  yield 'Chicago?'

这种方法一个有趣的方面是它并没有对输出片段到底要怎样组织做出假设。例如,你可以简单的使用 join() 方法将这些片段合并起来:

text = ''.join(sample())

或者你也可以将字符串片段重定向到I/O:

for part in sample():
  f.write(part)

再或者你还可以写出一些结合I/O操作的混合方案:

def combine(source, maxsize):
  parts = []
  size = 0
  for part in source:
    parts.append(part)
    size += len(part)
    if size > maxsize:
      yield ''.join(parts)
      parts = []
      size = 0
    yield ''.join(parts)

# 结合文件操作
with open('filename', 'w') as f:
  for part in combine(sample(), 32768):
    f.write(part)

这里的关键点在于原始的生成器函数并不需要知道使用细节,它只负责生成字符串片段就行了。

以上就是Python 合并拼接字符串的方法的详细内容,更多关于Python 合并拼接字符串的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python减少循环层次和缩进的技巧分析
Mar 15 Python
解决Python requests 报错方法集锦
Mar 19 Python
学习Python selenium自动化网页抓取器
Jan 20 Python
python抓取网页中链接的静态图片
Jan 29 Python
对python以16进制打印字节数组的方法详解
Jan 24 Python
Django框架模板语言实例小结【变量,标签,过滤器,继承,html转义】
May 23 Python
python 实现查找文件并输出满足某一条件的数据项方法
Jun 12 Python
pytorch-RNN进行回归曲线预测方式
Jan 14 Python
Python如何在DataFrame增加数值
Feb 14 Python
Python pandas如何向excel添加数据
May 22 Python
Python如何重新加载模块
Jul 29 Python
python字典的元素访问实例详解
Jul 21 Python
Python reques接口测试框架实现代码
Jul 28 #Python
如何用Matplotlib 画三维图的示例代码
Jul 28 #Python
Matplotlib.pyplot 三维绘图的实现示例
Jul 28 #Python
Python同时迭代多个序列的方法
Jul 28 #Python
Python如何读取、写入JSON数据
Jul 28 #Python
python3.6中anaconda安装sklearn踩坑实录
Jul 28 #Python
Python基于xlutils修改表格内容过程解析
Jul 28 #Python
You might like
MySQL GBK→UTF-8编码转换
2007/05/24 PHP
php抓取https的内容的代码
2010/04/06 PHP
ThinkPHP结合AjaxFileUploader实现无刷新文件上传的方法
2014/10/29 PHP
php页面函数设置超时限制的方法
2014/12/01 PHP
php ci 获取表单中多个同名input元素值的代码
2016/03/25 PHP
完美解决php 导出excle的.csv格式的数据时乱码问题
2017/02/18 PHP
jQuery的强大选择器小结
2009/12/27 Javascript
基于jquery实现的上传图片及图片大小验证、图片预览效果代码
2011/04/12 Javascript
JS获取后台Cookies值的小例子
2013/03/04 Javascript
input输入框的自动匹配(原生代码)
2013/03/19 Javascript
比较常见的javascript中定义函数的区别
2015/11/09 Javascript
jQuery实现HTML表格单元格的合并功能
2016/04/06 Javascript
AngularJS自定义指令详解(有分页插件代码)
2017/06/12 Javascript
利用Three.js如何实现阴影效果实例代码
2017/09/26 Javascript
element-ui中select组件绑定值改变,触发change事件方法
2018/08/24 Javascript
JavaScript工具库之Lodash详解
2019/06/15 Javascript
Jquery动态列功能完整实例
2019/08/30 jQuery
vue实现循环滚动列表
2020/06/30 Javascript
Vue切换组件实现返回后不重置数据,保留历史设置操作
2020/07/21 Javascript
npm ci命令的基本使用方法
2020/09/20 Javascript
Python json模块dumps、loads操作示例
2018/09/06 Python
numpy.meshgrid()理解(小结)
2019/08/01 Python
python实现超市商品销售管理系统
2019/11/22 Python
Tensorflow Summary用法学习笔记
2020/01/10 Python
基于nexus3配置Python仓库过程详解
2020/06/15 Python
用pandas划分数据集实现训练集和测试集
2020/07/20 Python
Django解决frame拒绝问题的方法
2020/12/18 Python
EJB的角色和三个对象
2015/12/31 面试题
培训楼经理岗位责任制
2014/02/10 职场文书
优秀少先队员主要事迹材料
2014/05/28 职场文书
2014年终工作总结范本
2014/12/15 职场文书
六一儿童节开幕词
2015/01/29 职场文书
2015建军节87周年演讲稿
2015/03/19 职场文书
2015年检验员工作总结范文
2015/04/30 职场文书
班级管理经验交流材料
2015/11/02 职场文书
Filebeat 采集 Nginx 日志的方法
2021/03/31 Servers