详细分析python3的reduce函数


Posted in Python onDecember 05, 2017

reduce() 函数在 python 2 是内置函数, 从python 3 开始移到了 functools 模块。

官方文档是这样介绍的

reduce(...)
reduce(function, sequence[, initial]) -> value

Apply a function of two arguments cumulatively to the items of a sequence,
from left to right, so as to reduce the sequence to a single value.
For example, reduce(lambda x, y: x+y, [1, 2, 3, 4, 5]) calculates
((((1+2)+3)+4)+5). If initial is present, it is placed before the items
of the sequence in the calculation, and serves as a default when the
sequence is empty.

从左到右对一个序列的项累计地应用有两个参数的函数,以此合并序列到一个单一值。

例如,reduce(lambda x, y: x+y, [1, 2, 3, 4, 5]) 计算的就是((((1+2)+3)+4)+5)。

如果提供了 initial 参数,计算时它将被放在序列的所有项前面,如果序列是空的,它也就是计算的默认结果值了

嗯, 这个文档其实不好理解。看了还是不懂。 序列 其实就是python中 tuple list dictionary string 以及其他可迭代物,别的编程语言可能有数组。

reduce 有 三个参数

function 有两个参数的函数, 必需参数
sequence tuple ,list ,dictionary, string等可迭代物,必需参数
initial 初始值, 可选参数

reduce的工作过程是 :在迭代sequence(tuple ,list ,dictionary, string等可迭代物)的过程中,首先把 前两个元素传给 函数参数,函数加工后,然后把得到的结果和第三个元素作为两个参数传给函数参数, 函数加工后得到的结果又和第四个元素作为两个参数传给函数参数,依次类推。 如果传入了 initial 值, 那么首先传的就不是 sequence 的第一个和第二个元素,而是 initial值和 第一个元素。经过这样的累计计算之后合并序列到一个单一返回值

reduce 代码举例,使用REPL演示

>>> def add(x, y):
...  return x+y
...
>>> from functools import reduce
>>> reduce(add, [1,2,3,4])
>>>

上面这段 reduce 代码,其实就相当于 1 + 2 + 3 + 4 = 10, 如果把加号改成乘号, 就成了阶乘了
当然 仅仅是求和的话还有更简单的方法,如下

>>> sum([1,2,3,4])
10
>>>

很多教程只讲了一个加法求和,太简单了,对新手加深理解还不够。下面讲点更深入的例子

还可以把一个整数列表拼成整数,如下

>>> from functools import reduce
>>> reduce(lambda x, y: x * 10 + y, [1 , 2, 3, 4, 5])
12345
>>>

对一个复杂的sequence使用reduce ,看下面代码,更多的代码不再使用REPL, 使用编辑器编写

from functools import reduce
scientists =({'name':'Alan Turing', 'age':105},
    {'name':'Dennis Ritchie', 'age':76},
    {'name':'John von Neumann', 'age':114},
    {'name':'Guido van Rossum', 'age':61})
def reducer(accumulator , value):
 sum = accumulator['age'] + value['age']
 return sum
total_age = reduce(reducer, scientists)
print(total_age)

这段代码会出错,看下图的执行过程

详细分析python3的reduce函数

所以代码需要修改

from functools import reduce
scientists =({'name':'Alan Turing', 'age':105, 'gender':'male'},
    {'name':'Dennis Ritchie', 'age':76, 'gender':'male'},
    {'name':'Ada Lovelace', 'age':202, 'gender':'female'},
    {'name':'Frances E. Allen', 'age':84, 'gender':'female'})
def reducer(accumulator , value):
 sum = accumulator + value['age']
 return sum
total_age = reduce(reducer, scientists, 0)
print(total_age)

7, 9 行 红色部分就是修改 部分。 通过 help(reduce) 查看 文档,reduce 有三个参数, 第三个参数是初始值的意思,是可有可无的参数。

修改之后就不出错了,流程如下

详细分析python3的reduce函数

这个仍然也可以用 sum 来更简单的完成

sum([x['age'] for x in scientists ])

做点更高级的事情,按性别分组

from functools import reduce
scientists =({'name':'Alan Turing', 'age':105, 'gender':'male'},
    {'name':'Dennis Ritchie', 'age':76, 'gender':'male'},
    {'name':'Ada Lovelace', 'age':202, 'gender':'female'},
    {'name':'Frances E. Allen', 'age':84, 'gender':'female'})
def group_by_gender(accumulator , value):
 accumulator[value['gender']].append(value['name'])
 return accumulator
grouped = reduce(group_by_gender, scientists, {'male':[], 'female':[]})
print(grouped)

输出

{'male': ['Alan Turing', 'Dennis Ritchie'], 'female': ['Ada Lovelace', 'Frances E. Allen']}

可以看到,在 reduce 的初始值参数传入了一个dictionary,, 但是这样写 key 可能出错,还能再进一步自动化,运行时动态插入key

修改代码如下

grouped = reduce(group_by_gender, scientists, collections.defaultdict(list))

当然 先要 import collections 模块

这当然也能用 pythonic way 去解决

import itertools
scientists =({'name':'Alan Turing', 'age':105, 'gender':'male'},
    {'name':'Dennis Ritchie', 'age':76, 'gender':'male'},
    {'name':'Ada Lovelace', 'age':202, 'gender':'female'},
    {'name':'Frances E. Allen', 'age':84, 'gender':'female'})
grouped = {item[0]:list(item[1])
   for item in itertools.groupby(scientists, lambda x: x['gender'])}
print(grouped)

再来一个更晦涩难懂的玩法。工作中要与其他人协作的话,不建议这么用,与上面的例子做同样的事,看不懂无所谓。

from functools import reduce
scientists =({'name':'Alan Turing', 'age':105, 'gender':'male'},
    {'name':'Dennis Ritchie', 'age':76, 'gender':'male'},
    {'name':'Ada Lovelace', 'age':202, 'gender':'female'},
    {'name':'Frances E. Allen', 'age':84, 'gender':'female'})
grouped = reduce(lambda acc, val: {**acc, **{val['gender']: acc[val['gender']]+ [val['name']]}}, scientists, {'male':[], 'female':[]})
print(grouped)

**acc, **{val['gneder']... 这里使用了 dictionary merge syntax , 从 python 3.5 开始引入, 详情请看 PEP 448 - Additional Unpacking Generalizations 怎么使用可以参考这个 python - How to merge two dictionaries in a single expression? - Stack Overflow

python 社区推荐写可读性好的代码,有更好的选择时不建议用reduce,所以 python 2 中内置的reduce 函数 移到了 functools模块中

Python 相关文章推荐
python爬虫常用的模块分析
Aug 29 Python
python使用pymysql实现操作mysql
Sep 13 Python
python 开发的三种运行模式详细介绍
Jan 18 Python
Python实现读取及写入csv文件的方法示例
Jan 12 Python
python实现旋转和水平翻转的方法
Oct 25 Python
关于python3中setup.py小概念解析
Aug 22 Python
python常见字符串处理函数与用法汇总
Oct 30 Python
tensorflow pb to tflite 精度下降详解
May 25 Python
Python常用数字处理基本操作汇总
Sep 10 Python
python如何遍历指定路径下所有文件(按按照时间区间检索)
Sep 14 Python
python闭包与引用以及需要注意的陷阱
Sep 18 Python
Python基本知识点总结
Apr 07 Python
Python数据可视化正态分布简单分析及实现代码
Dec 04 #Python
Python编程实现二分法和牛顿迭代法求平方根代码
Dec 04 #Python
Python编程给numpy矩阵添加一列方法示例
Dec 04 #Python
Python实现返回数组中第i小元素的方法示例
Dec 04 #Python
Python实现基本数据结构中队列的操作方法示例
Dec 04 #Python
Python numpy生成矩阵、串联矩阵代码分享
Dec 04 #Python
Python内置函数—vars的具体使用方法
Dec 04 #Python
You might like
浅析关于PHP位运算的简单权限设计
2013/06/30 PHP
一个PHP的ZIP压缩类分享
2014/05/04 PHP
php中请求url的五种方法总结
2017/07/13 PHP
window.onbeforeunload方法在IE下无法正常工作的解决办法
2010/01/23 Javascript
jQuery Dialog 弹出层对话框插件
2010/08/09 Javascript
iframe 异步加载技术及性能分析
2011/07/19 Javascript
jquery选择器的选择使用及性能介绍
2013/01/16 Javascript
js使用for循环及if语句判断多个一样的name
2014/09/09 Javascript
IE6/IE7中JavaScript json提示缺少标识符、字符串或数字问题处理
2014/12/16 Javascript
JavaScript实现梯形乘法表的方法
2015/04/25 Javascript
基于jquery实现表格无刷新分页
2016/01/07 Javascript
Bootstrap幻灯片轮播图支持触屏左右手势滑动的实现方法
2016/10/13 Javascript
原生js实现吸顶效果
2017/03/13 Javascript
easyui下拉框动态级联加载的示例代码
2017/11/29 Javascript
js中值引用和地址引用实例分析
2019/06/21 Javascript
微信小程序wxml列表渲染原理解析
2019/11/27 Javascript
解决vue项目运行npm run serve报错的问题
2020/10/26 Javascript
使用Python读写及压缩和解压缩文件的示例
2016/07/08 Python
利用python编写一个图片主色转换的脚本
2017/12/07 Python
Python DataFrame 设置输出不显示index(索引)值的方法
2018/06/07 Python
使用Python自动化破解自定义字体混淆信息的方法实例
2019/02/13 Python
对python周期性定时器的示例详解
2019/02/19 Python
使用PyQt4 设置TextEdit背景的方法
2019/06/14 Python
python 杀死自身进程的实现方法
2019/07/01 Python
NOTINO英国:在线购买美容和香水
2020/02/25 全球购物
傲盾软件面试题
2015/08/17 面试题
艺术专业大学生自我评价
2013/09/22 职场文书
浪漫婚礼主题活动策划方案
2014/09/15 职场文书
乡镇党的群众路线对照检查材料
2014/09/24 职场文书
二年级语文上册复习计划
2015/01/19 职场文书
2015年工程师工作总结
2015/04/30 职场文书
信用卡收入证明范本
2015/06/12 职场文书
公司员工宿舍管理制度
2015/08/07 职场文书
Vue CLI中模式与环境变量的深入详解
2021/05/30 Vue.js
详解Spring事件发布与监听机制
2021/06/30 Java/Android
JavaScript实现九宫格拖拽效果
2022/06/28 Javascript