Python函数式编程中itertools模块详解


Posted in Python onSeptember 15, 2021

容器与可迭代对象

在正式开始前先补充一些基本概念在 Python 中存在容器 与 可迭代对象

  • 容器:用来存储多个元素的数据结构,例如 列表,元组,字典,集合等内容;
  • 可迭代对象:实现了 __iter__ 方法的对象就叫做可迭代对象。

从可迭代对象中还衍生出 迭代器 与 生成器:

  • 迭代器:既实现了 __iter__,也实现了 __next__ 方法的对象叫做迭代器;
  • 生成器:具有 yield 关键字的函数都是生成器。

这样就比较清楚了,可迭代对象的范围要大于容器。而且可迭代对象只能使用一次,使用完毕再获取值就会提示 StopIteration 异常。

除此之外,可迭代对象还有一些限制:

  • 不能对可迭代对象使用 len 函数;
  • 可以使用 next 方法处理可迭代对象,容器也可以通过 iter 函数转换成迭代器;
  • for 语句会自动调用容器的 iter 函数,所以容器也能被循环迭代。

count() 函数

count 函数一般与 range 函数对比学习,例如 range 函数需要定义生成范围的下限,上限与步长可选,而 count 函数不同,指定下限与步长,上限值不用声明。

函数原型声明如下

count(start=0, step=1) --> count object

测试代码如下,其中必须添加跳出循环的判定条件,否则代码会一直运行下去。

from itertools import count
a = count(5, 10)
for i in a:
    print(i)
    if i > 100:
        break

除此之外,count 函数还接收非整数参数,所以下述代码中定义的也是正确的。

from itertools import count
a = count(0.5, 0.1)
for i in a:
    print(i)
    if i > 100:
        break

cycle 函数

用 cycle 函数可以循环一组值,测试代码如下所示:

from itertools import cycle
x = cycle('梦想橡皮擦abcdf')
for i in range(5):
    print(next(x), end=" ")
print("\n")
print("*" * 100)
for i in range(5):
    print(next(x), end=" ")

代码输出如下内容:

梦 想 橡 皮 擦

****************************************************************************************************
a b c d f

可以看到 cycle 函数与 for 循环非常类似。

repeat 函数

repeat 函数用于重复返回某个值,官方给出的函数描述如下所示:

class repeat(object):
    """
    repeat(object [,times]) -> create an iterator which returns the object
    for the specified number of times.  If not specified, returns the object
    endlessly.

进行一下简单的测试,看一下效果:

from itertools import repeat
x = repeat('橡皮擦')
for i in range(5):
    print(next(x), end=" ")
print("\n")
print("*" * 100)
for i in range(5):
    print(next(x), end=" ")

怎么看这个函数,都好像没有太大用处。

enumerate 函数,添加序号

这个函数在前面的文章中,已经进行过简单介绍,并且该函数在 __builtins__ 包中,所以不再过多说明,基本格式如下所示:

enumerate(sequence, [start=0])

其中 start 参数是下标起始位置。

accumulate 函数

该函数基于给定的函数返回一个可迭代对象,默认是累加效果,即第二个参数为 operator.add,测试代码如下:

from itertools import accumulate
data = [1, 2, 3, 4, 5]
# 计算累积和
print(list(accumulate(data)))  # [1, 3, 6, 10, 15]

针对上述代码,修改为累积。

from itertools import accumulate
import operator
data = [1, 2, 3, 4, 5]
# 计算累积
print(list(accumulate(data, operator.mul)))

除此之外,第二个参数还可以为 max,min 等函数,例如下述代码:

from itertools import accumulate
data = [1, 4, 3, 2, 5]
print(list(accumulate(data, max)))

代码输出如下内容,其实是将 data 里面的任意两个值进行了比较,然后留下最大的值。

[1, 4, 4, 4, 5]

chain 与 groupby 函数

chain 函数用于将多个迭代器组合为单个迭代器,而 groupby 可以将一个迭代器且分为多个子迭代器。

首先展示一下 groupby 函数的应用:

from itertools import groupby
a = list(groupby('橡橡皮皮擦擦'))
print(a)

输出内容如下所示:

[('橡', <itertools._grouper object at 0x0000000001DD9438>),
('皮', <itertools._grouper object at 0x0000000001DD9278>),
('擦', <itertools._grouper object at 0x00000000021FF710>)]

为了使用 groupby 函数,建议先对原列表进行排序,因为它是有点像切片一样,发现不同的就分出一个迭代器。

chain 函数的用法如下,将多个迭代对象进行拼接:

from itertools import groupby, chain
a = list(chain('ABC', 'AAA', range(1,3)))
print(a)

zip_longest 与 zip

zip 函数在之前的博客中已经进行过说明,zip_longest 与 zip 的区别就是,zip 返回的结果以最短的序列为准,而 zip_longest 以最长的为准。

测试代码如下,自行比对结果即可。

from itertools import zip_longest
a = list(zip('ABC', range(5), [10, 20, 30, 40]))
print(a)
a = list(zip_longest('ABC', range(5), [10, 20, 30, 40]))
print(a)

zip_logest 如果碰到长度不一致的序列,缺少部分会填充 None。

tee 函数

tee 函数可以克隆可迭代对象,产出多个生成器,每个生成器都可以产出输入的各个元素。

from itertools import tee
a = list(tee('橡皮擦'))
print(a)

compress 函数

该函数通过**谓词(是否,True/False)**来确定对某个元素的取舍问题,最简单的代码如下所示:

from itertools import compress
a = list(compress('橡皮擦', (0, 1, 1)))
print(a)

islice、dropwhile、takewhile、filterfalse、filter

这几个函数都是从输入的可迭代对象中获取一个子集,而且不修改元素本身。

本部分只罗列各个函数的原型声明,具体用法直接参考使用即可。

islice(iterable, stop) --> islice object
islice(iterable, start, stop[, step]) --> islice object
dropwhile(predicate, iterable) --> dropwhile object
takewhile(predicate, iterable) --> takewhile object
filterfalse(function or None, sequence) --> filterfalse object

其中只有 filterfalse 中的参数是函数在前,序列在后。

测试代码如下,尤其注意第一个参数是 callable 即函数。

from itertools import islice, dropwhile, takewhile, filterfalse
a = list(filterfalse(lambda x: x in ["皮", "擦"], '橡皮擦'))
print(a)

总结

以上内容就是本文的全部内容,在使用无限迭代器函数 count,cycle,repeat 的时候,一定要注意即使停止。

本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注三水点靠木的更多内容!

Python 相关文章推荐
python使用os模块的os.walk遍历文件夹示例
Jan 27 Python
python字符串连接的N种方式总结
Sep 17 Python
python开发之基于thread线程搜索本地文件的方法
Nov 11 Python
python实现协同过滤推荐算法完整代码示例
Dec 15 Python
Python线性方程组求解运算示例
Jan 17 Python
Python 元类实例解析
Apr 04 Python
python框架flask表单实现详解
Nov 04 Python
使用python快速在局域网内搭建http传输文件服务的方法
Nov 14 Python
基于Numba提高python运行效率过程解析
Mar 02 Python
Django models文件模型变更错误解决
May 11 Python
python的链表基础知识点
Sep 13 Python
详解Python小数据池和代码块缓存机制
Apr 07 Python
Python编程中Python与GIL互斥锁关系作用分析
Sep 15 #Python
Python3.10的一些新特性原理分析
Sep 15 #Python
一篇文章带你了解Python和Java的正则表达式对比
Sep 15 #Python
Python编程编写完善的命令行工具
Sep 15 #Python
python可视化之颜色映射详解
python的变量和简单数字类型详解
Sep 15 #Python
深入浅析Django MTV模式
You might like
php 三维饼图的实现代码
2008/09/28 PHP
分享一则PHP定义函数代码
2015/02/26 PHP
jquery 模拟雅虎首页的点击对话框效果
2010/04/11 Javascript
JavaScript开发规范要求(规范化代码)
2010/08/16 Javascript
JS字符串处理实例代码
2013/08/05 Javascript
js Math 对象的方法
2013/09/01 Javascript
JQuery对id中含有特殊字符的转义处理示例
2013/09/06 Javascript
浅析Js中的单引号与双引号问题
2013/11/06 Javascript
动态加载dtree.js树treeview(示例代码)
2013/12/17 Javascript
jquery的attr方法禁用表单元素禁用输入内容
2014/06/23 Javascript
JS动态修改表格cellPadding和cellSpacing的方法
2015/03/31 Javascript
js实现点击按钮弹出上传文件的窗口
2016/12/23 Javascript
js实现tab选项卡切换功能
2017/01/13 Javascript
js实现股票实时刷新数据案例
2017/05/14 Javascript
jQuery Datatables表头不对齐的解决办法
2017/11/27 jQuery
利用nodeJs anywhere搭建本地服务器环境的方法
2018/05/12 NodeJs
js嵌套的数组扁平化:将多维数组变成一维数组以及push()与concat()区别的讲解
2019/01/19 Javascript
python logging 日志轮转文件不删除问题的解决方法
2016/08/02 Python
python爬虫中get和post方法介绍以及cookie作用
2018/02/08 Python
Python求两个圆的交点坐标或三个圆的交点坐标方法
2018/11/07 Python
在pycharm中设置显示行数的方法
2019/01/16 Python
Python生成MD5值的两种方法实例分析
2019/04/26 Python
python global和nonlocal用法解析
2020/02/03 Python
CSS3使用transition属性实现过渡效果
2018/04/18 HTML / CSS
旅游网创业计划书
2014/01/31 职场文书
2014年商场工作总结
2014/11/22 职场文书
2015年干部教育培训工作总结
2015/05/15 职场文书
幼儿园大班开学寄语(2015秋季)
2015/05/27 职场文书
领导欢送会主持词
2015/07/06 职场文书
2016年幼儿园庆六一开幕词
2016/03/04 职场文书
python随机打印成绩排名表
2021/06/23 Python
适合后台管理系统开发的12个前端框架(小结)
2021/06/29 Javascript
Oracle 临时表空间SQL语句的实现
2021/09/25 Oracle
Django+Nginx+uWSGI 定时任务的实现方法
2022/01/22 Python
使用Nginx的访问日志统计PV与UV
2022/05/06 Servers
Python实现数据的序列化操作详解
2022/07/07 Python