详细分析python3的reduce函数


Posted in Python onDecember 05, 2017

reduce() 函数在 python 2 是内置函数, 从python 3 开始移到了 functools 模块。

官方文档是这样介绍的

reduce(...)
reduce(function, sequence[, initial]) -> value

Apply a function of two arguments cumulatively to the items of a sequence,
from left to right, so as to reduce the sequence to a single value.
For example, reduce(lambda x, y: x+y, [1, 2, 3, 4, 5]) calculates
((((1+2)+3)+4)+5). If initial is present, it is placed before the items
of the sequence in the calculation, and serves as a default when the
sequence is empty.

从左到右对一个序列的项累计地应用有两个参数的函数,以此合并序列到一个单一值。

例如,reduce(lambda x, y: x+y, [1, 2, 3, 4, 5]) 计算的就是((((1+2)+3)+4)+5)。

如果提供了 initial 参数,计算时它将被放在序列的所有项前面,如果序列是空的,它也就是计算的默认结果值了

嗯, 这个文档其实不好理解。看了还是不懂。 序列 其实就是python中 tuple list dictionary string 以及其他可迭代物,别的编程语言可能有数组。

reduce 有 三个参数

function 有两个参数的函数, 必需参数
sequence tuple ,list ,dictionary, string等可迭代物,必需参数
initial 初始值, 可选参数

reduce的工作过程是 :在迭代sequence(tuple ,list ,dictionary, string等可迭代物)的过程中,首先把 前两个元素传给 函数参数,函数加工后,然后把得到的结果和第三个元素作为两个参数传给函数参数, 函数加工后得到的结果又和第四个元素作为两个参数传给函数参数,依次类推。 如果传入了 initial 值, 那么首先传的就不是 sequence 的第一个和第二个元素,而是 initial值和 第一个元素。经过这样的累计计算之后合并序列到一个单一返回值

reduce 代码举例,使用REPL演示

>>> def add(x, y):
...  return x+y
...
>>> from functools import reduce
>>> reduce(add, [1,2,3,4])
>>>

上面这段 reduce 代码,其实就相当于 1 + 2 + 3 + 4 = 10, 如果把加号改成乘号, 就成了阶乘了
当然 仅仅是求和的话还有更简单的方法,如下

>>> sum([1,2,3,4])
10
>>>

很多教程只讲了一个加法求和,太简单了,对新手加深理解还不够。下面讲点更深入的例子

还可以把一个整数列表拼成整数,如下

>>> from functools import reduce
>>> reduce(lambda x, y: x * 10 + y, [1 , 2, 3, 4, 5])
12345
>>>

对一个复杂的sequence使用reduce ,看下面代码,更多的代码不再使用REPL, 使用编辑器编写

from functools import reduce
scientists =({'name':'Alan Turing', 'age':105},
    {'name':'Dennis Ritchie', 'age':76},
    {'name':'John von Neumann', 'age':114},
    {'name':'Guido van Rossum', 'age':61})
def reducer(accumulator , value):
 sum = accumulator['age'] + value['age']
 return sum
total_age = reduce(reducer, scientists)
print(total_age)

这段代码会出错,看下图的执行过程

详细分析python3的reduce函数

所以代码需要修改

from functools import reduce
scientists =({'name':'Alan Turing', 'age':105, 'gender':'male'},
    {'name':'Dennis Ritchie', 'age':76, 'gender':'male'},
    {'name':'Ada Lovelace', 'age':202, 'gender':'female'},
    {'name':'Frances E. Allen', 'age':84, 'gender':'female'})
def reducer(accumulator , value):
 sum = accumulator + value['age']
 return sum
total_age = reduce(reducer, scientists, 0)
print(total_age)

7, 9 行 红色部分就是修改 部分。 通过 help(reduce) 查看 文档,reduce 有三个参数, 第三个参数是初始值的意思,是可有可无的参数。

修改之后就不出错了,流程如下

详细分析python3的reduce函数

这个仍然也可以用 sum 来更简单的完成

sum([x['age'] for x in scientists ])

做点更高级的事情,按性别分组

from functools import reduce
scientists =({'name':'Alan Turing', 'age':105, 'gender':'male'},
    {'name':'Dennis Ritchie', 'age':76, 'gender':'male'},
    {'name':'Ada Lovelace', 'age':202, 'gender':'female'},
    {'name':'Frances E. Allen', 'age':84, 'gender':'female'})
def group_by_gender(accumulator , value):
 accumulator[value['gender']].append(value['name'])
 return accumulator
grouped = reduce(group_by_gender, scientists, {'male':[], 'female':[]})
print(grouped)

输出

{'male': ['Alan Turing', 'Dennis Ritchie'], 'female': ['Ada Lovelace', 'Frances E. Allen']}

可以看到,在 reduce 的初始值参数传入了一个dictionary,, 但是这样写 key 可能出错,还能再进一步自动化,运行时动态插入key

修改代码如下

grouped = reduce(group_by_gender, scientists, collections.defaultdict(list))

当然 先要 import collections 模块

这当然也能用 pythonic way 去解决

import itertools
scientists =({'name':'Alan Turing', 'age':105, 'gender':'male'},
    {'name':'Dennis Ritchie', 'age':76, 'gender':'male'},
    {'name':'Ada Lovelace', 'age':202, 'gender':'female'},
    {'name':'Frances E. Allen', 'age':84, 'gender':'female'})
grouped = {item[0]:list(item[1])
   for item in itertools.groupby(scientists, lambda x: x['gender'])}
print(grouped)

再来一个更晦涩难懂的玩法。工作中要与其他人协作的话,不建议这么用,与上面的例子做同样的事,看不懂无所谓。

from functools import reduce
scientists =({'name':'Alan Turing', 'age':105, 'gender':'male'},
    {'name':'Dennis Ritchie', 'age':76, 'gender':'male'},
    {'name':'Ada Lovelace', 'age':202, 'gender':'female'},
    {'name':'Frances E. Allen', 'age':84, 'gender':'female'})
grouped = reduce(lambda acc, val: {**acc, **{val['gender']: acc[val['gender']]+ [val['name']]}}, scientists, {'male':[], 'female':[]})
print(grouped)

**acc, **{val['gneder']... 这里使用了 dictionary merge syntax , 从 python 3.5 开始引入, 详情请看 PEP 448 - Additional Unpacking Generalizations 怎么使用可以参考这个 python - How to merge two dictionaries in a single expression? - Stack Overflow

python 社区推荐写可读性好的代码,有更好的选择时不建议用reduce,所以 python 2 中内置的reduce 函数 移到了 functools模块中

Python 相关文章推荐
Django接受前端数据的几种方法总结
Nov 04 Python
python3监控CentOS磁盘空间脚本
Jun 21 Python
Flask框架实现给视图函数增加装饰器操作示例
Jul 16 Python
opencv python 基于KNN的手写体识别的实例
Aug 03 Python
Python面向对象之静态属性、类方法与静态方法分析
Aug 24 Python
python实现指定字符串补全空格、前面填充0的方法
Nov 16 Python
python元组和字典的内建函数实例详解
Oct 22 Python
关于Pytorch的MLP模块实现方式
Jan 07 Python
什么是python的函数体
Jun 19 Python
为什么相对PHP黑python的更少
Jun 21 Python
Python使用pyecharts控件绘制图表
Jun 05 Python
Python可视化神器pyecharts之绘制箱形图
Jul 07 Python
Python数据可视化正态分布简单分析及实现代码
Dec 04 #Python
Python编程实现二分法和牛顿迭代法求平方根代码
Dec 04 #Python
Python编程给numpy矩阵添加一列方法示例
Dec 04 #Python
Python实现返回数组中第i小元素的方法示例
Dec 04 #Python
Python实现基本数据结构中队列的操作方法示例
Dec 04 #Python
Python numpy生成矩阵、串联矩阵代码分享
Dec 04 #Python
Python内置函数—vars的具体使用方法
Dec 04 #Python
You might like
967 个函式
2006/10/09 PHP
php中如何防止表单的重复提交
2013/08/02 PHP
PHP验证码函数代码(简单实用)
2013/09/29 PHP
php flush无效,IIS7下php实时输出的方法
2016/08/25 PHP
几款极品的javascript压缩混淆工具
2007/05/16 Javascript
javascript 面向对象继承
2009/11/26 Javascript
分享14个很酷的jQuery导航菜单插件
2011/04/25 Javascript
JavaScript高级程序设计阅读笔记(六) ECMAScript中的运算符(二)
2012/02/27 Javascript
Jquery刷新页面背景图片随机变换的实现方法
2013/03/15 Javascript
使用JavaScript获取电池状态的方法
2014/05/03 Javascript
jquery引用方法时传递参数原理分析
2014/10/13 Javascript
js中利用tagname和id获取元素的方法
2016/01/03 Javascript
基于JavaScript实现div层跟随滚动条滑动
2016/01/12 Javascript
纯JavaScript实现实时反馈系统时间
2017/10/26 Javascript
python实现的简单文本类游戏实例
2015/04/28 Python
为Python的Tornado框架配置使用Jinja2模板引擎的方法
2016/06/30 Python
Python 通过URL打开图片实例详解
2017/06/01 Python
Python并发编程协程(Coroutine)之Gevent详解
2017/12/27 Python
python3.6连接MySQL和表的创建与删除实例代码
2017/12/28 Python
Python使用pickle模块存储数据报错解决示例代码
2018/01/26 Python
python购物车程序简单代码
2018/04/18 Python
Python利用pandas计算多个CSV文件数据值的实例
2018/04/19 Python
python框架中flask知识点总结
2018/08/17 Python
CSS3中box-shadow的用法介绍
2015/07/15 HTML / CSS
Html5 web本地存储实例详解
2016/07/28 HTML / CSS
纽约服装和生活方式品牌:Saturdays NYC
2017/08/13 全球购物
加拿大时尚潮流大码女装购物网站:Addition Elle
2018/04/02 全球购物
软件测试有哪些?什么是配置项?
2012/02/12 面试题
项目计划书范文
2014/01/09 职场文书
致1500米运动员广播稿
2014/02/07 职场文书
工程专业求职自荐书范文
2014/02/18 职场文书
4s店活动策划方案
2014/08/25 职场文书
职场干货:简历中的自我评价应该这样写!
2019/05/06 职场文书
一次Mysql update sql不当引起的生产故障记录
2022/04/01 MySQL
Spring Boot 实现 WebSocket
2022/04/30 Java/Android
Go 内联优化让程序员爱不释手
2022/06/21 Golang