学会迭代器设计模式,帮你大幅提升python性能


Posted in Python onJanuary 03, 2021

大家好,我们的git专题已经更新结束了,所以开始继续给大家写一点设计模式的内容。

今天给大家介绍的设计模式非常简单,叫做iterator,也就是迭代器模式。迭代器是Python语言当中一个非常重要的内容,借助迭代器我们可以很方便地实现很多复杂的功能。在深度学习当中,数据的获取往往也是通过迭代器实现的。因此这部分的内容非常重要,推荐大家一定要掌握。

简单案例

在开始介绍设计模式之前,我们先来看一个简单的需求。假设现在我们需要根据传入的变量获取每周的前几天,比如说我们传入3返回的就是[Mon, Tue, Wed],我们传入5返回[Mon, Tue, Wed, Thu, Fri]。这个需求大家应该都能理解,非常非常简单。

如果用一个函数来实现的话,就是这样:

def return_days(n):
    week = ['Mon', 'Tue', 'Wed', 'Thu', 'Fri', 'Sat', 'Sun']
    return week[:n]

你看三行代码就实现了,在这个问题场景当中这样写当然是没有问题。但假如我们把题目稍微变一变,这里的week不是一个固定的数据,而是从上游或者是某个文件当中读取的。这里的n也是一个很大的数,我们把这个函数改写成这样:

def get_data(n):
    data = []
    for i in range(n):
        data.append(get_from_upstream())
    return data

我们假设get_from_upstream这个函数当中实现了获取数据的具体逻辑,那么上面这一段函数有一个什么问题?

有些同学会说这没有问题啊,因为像是其他语言实现数据获取的时候也都是这么干的。的确,像是Java等语言可能都是这么干的。但是其他语言这么干没错,不代表Python这么干也没错。因为我们没有把Python的能力发挥到最大。

这里有两个问题,第一个问题是延迟,因为前面说了,n是一个很大的数。我们从上游获取数据,无论是通过网络还是文件读取,本质上都是IO操作,IO操作的延迟是非常大的。那么我们把这n条数据全部搜集完可能需要很长的时间,导致下游的漫长等待。第二个问题就是内存,因为我们存储了这n条数据一起返回的,如果n很大,对于内存的开销压力也很大,如果机器内存不够很有可能导致崩溃。

那怎么解决呢?

其实解决的方法很简单,如果对迭代器熟悉的话,会发现迭代器针对的恰恰是这两个问题。我们把上面的逻辑改写成迭代器实现即可,这也就是iterator模式。

iterator模式

iterator模式严格说起来其实只是迭代器的一种应用,它非常巧妙地将迭代器与匿名函数结合在一起,里面也没有太多的门道可以说,我们把刚才的代码改写一下,细节都在代码当中。

def get_data(n):
    for i in range(n):
  yield get_from_upstream()


data_10 = lambda: get_data(10)
data_100 = lambda: get_data(100)

# use
for d in data_10:
    print(d)

很简单吧,但可能你要问了,我们既然写出了get_data这个迭代器,那么我们使用的时候直接for d in get_data(10)这样用不就好了,为什么中间要用匿名函数包一层呢?

道理也很简单,如果这个数据是我们自己使用,当然是没必要中间包一层的。但如果我们是传给下游使用的话,对于下游来说它肯定是不希望考虑上游太多的细节的,越简单越好。所以我们直接丢一个包装好的迭代器过去,下游直接call即可。否则的话,下游还需要感知get_data这个函数传入的参数,显然是不够合理的。

以上就是学会迭代器设计模式,帮你大幅提升python性能的详细内容,更多关于python 迭代器设计模式的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python和Perl绘制中国北京跑步地图的方法
Mar 03 Python
python中join()方法介绍
Oct 11 Python
python利用thrift服务读取hbase数据的方法
Dec 27 Python
python实现关闭第三方窗口的方法
Jun 28 Python
django框架ModelForm组件用法详解
Dec 11 Python
Python Gluon参数和模块命名操作教程
Dec 18 Python
使用python快速实现不同机器间文件夹共享方式
Dec 22 Python
pytorch判断是否cuda 判断变量类型方式
Jun 23 Python
python调用私有属性的方法总结
Jul 24 Python
Python 常用日期处理 -- calendar 与 dateutil 模块的使用
Sep 02 Python
Python tempfile模块生成临时文件和临时目录
Sep 30 Python
Python使用socket_TCP实现小文件下载功能
Oct 09 Python
Python编写万花尺图案实例
Jan 03 #Python
Python 实现一个简单的web服务器
Jan 03 #Python
关于Python错误重试方法总结
Jan 03 #Python
详解python中的异常和文件读写
Jan 03 #Python
python绘制雷达图实例讲解
Jan 03 #Python
python 使用xlsxwriter循环向excel中插入数据和图片的操作
Jan 01 #Python
python安装mysql的依赖包mysql-python操作
Jan 01 #Python
You might like
动态生成gif格式的图像要注意?
2006/10/09 PHP
PHP FTP操作类代码( 上传、拷贝、移动、删除文件/创建目录)
2014/05/10 PHP
thinkphp特殊标签用法概述
2014/11/24 PHP
php制作动态随机验证码
2015/02/12 PHP
PHP如何将XML转成数组
2016/04/04 PHP
YII框架实现自定义第三方扩展操作示例
2019/04/26 PHP
PHP实现给定一列字符,生成指定长度的所有可能组合示例
2019/06/22 PHP
javascript入门·对象属性方法大总结
2007/10/01 Javascript
jquery form表单提交插件asp.net后台中文解码
2010/06/12 Javascript
浅析jQuery中常用的元素查找方法总结
2013/07/04 Javascript
javascript实现div浮动在网页最顶上并带关闭按钮效果实例
2013/08/13 Javascript
jQuery同步提交示例代码
2015/12/12 Javascript
JavaScript中日期函数的相关操作知识
2016/08/03 Javascript
手机移动端实现 jquery和HTML5 Canvas的幸运大奖盘特效
2016/12/06 Javascript
Vue单页面应用保证F5强刷不清空数据的解决方案
2018/01/31 Javascript
JavaScript防止全局变量污染的方法总结
2018/08/02 Javascript
JavaScript引用类型Object常见用法实例分析
2018/08/08 Javascript
Django 实现购物车功能的示例代码
2018/10/08 Python
深入浅析Python中的迭代器
2019/06/04 Python
对python tkinter窗口弹出置顶的方法详解
2019/06/14 Python
python爬虫刷访问量 2019 7月
2019/08/01 Python
Flask框架学习笔记之消息提示与异常处理操作详解
2019/08/15 Python
Python中zip()函数的简单用法举例
2019/09/02 Python
Python之指数与E记法的区别详解
2019/11/21 Python
PyCharm 专业版安装图文教程
2020/02/20 Python
音频处理 windows10下python三方库librosa安装教程
2020/06/20 Python
python用Configobj模块读取配置文件
2020/09/26 Python
用CSS3来实现社交分享按钮
2014/11/11 HTML / CSS
html5 sessionStorage会话存储_动力节点Java学院整理
2017/07/06 HTML / CSS
30年同学聚会邀请函
2014/01/25 职场文书
幼儿园中秋节活动方案2013
2014/01/29 职场文书
人力资源管理系自荐信
2014/05/31 职场文书
应急管理工作总结2015
2015/05/04 职场文书
教师素质教育心得体会
2016/01/19 职场文书
用Python将库打包发布到pypi
2021/04/13 Python
Redis基本数据类型Set常用操作命令
2022/06/01 Redis