利用Fn.py库在Python中进行函数式编程


Posted in Python onApril 22, 2015

尽管Python事实上并不是一门纯函数式编程语言,但它本身是一门多范型语言,并给了你足够的自由利用函数式编程的便利。函数式风格有着各种理论与实际上的好处(你可以在Python的文档中找到这个列表):

  •     形式上可证
  •     模块性
  •     组合性
  •     易于调试及测试

虽然这份列表已经描述得够清楚了,但我还是很喜欢Michael O.Church在他的文章“函数式程序极少腐坏(Functional programs rarely rot)”中对函数式编程的优点所作的描述。我在PyCon UA 2012期间的讲座“Functional Programming with Python”中谈论了在Python中使用函数式方式的内容。我也提到,在你尝试在Python中编写可读同时又可维护的函数式代码时,你会很快发现诸多问题。

fn.py类库就是为了应对这些问题而诞生的。尽管它不可能解决所有问题,但对于希望从函数式编程方式中获取最大价值的开发者而言,它是一块“电池”,即使是在命令式方式占主导地位的程序中,也能够发挥作用。那么,它里面都有些什么呢?
Scala风格的Lambda定义

在Python中创建Lambda函数的语法非常冗长,来比较一下:

Python

map(lambda x: x*2, [1,2,3])

Scala

List(1,2,3).map(_*2)

Clojure

(map #(* % 2) '(1 2 3))

Haskell

map (2*) [1,2,3]

受Scala的启发,Fn.py提供了一个特别的_对象以简化Lambda语法。

from fn import _

assert (_ + _)(10, 5) = 15
assert list(map(_ * 2, range(5))) == [0,2,4,6,8]
assert list(filter(_ < 10, [9,10,11])) == [9]

除此之外还有许多场景可以使用_:所有的算术操作、属性解析、方法调用及分片算法。如果你不确定你的函数具体会做些什么,你可以将结果打印出来:

from fn import _ 

print (_ + 2) # "(x1) => (x1 + 2)" 
print (_ + _ * _) # "(x1, x2, x3) => (x1 + (x2 * x3))"

流(Stream)及无限序列的声明

Scala风格的惰性求值(Lazy-evaluated)流。其基本思路是:对每个新元素“按需”取值,并在所创建的全部迭代中共享计算出的元素值。Stream对象支持<<操作符,代表在需要时将新元素推入其中。

惰性求值流对无限序列的处理是一个强大的抽象。我们来看看在函数式编程语言中如何计算一个斐波那契序列。

Haskell

fibs = 0 : 1 : zipWith (+) fibs (tail fibs)

Clojure

(def fib (lazy-cat [0 1] (map + fib (rest fib))))

Scala

def fibs: Stream[Int] = 

     0 #:: 1 #:: fibs.zip(fibs.tail).map{case (a,b) => a + b}

现在你可以在Python中使用同样的方式了:

from fn import Stream 
from fn.iters import take, drop, map
from operator import add

f = Stream()
fib = f << [0, 1] << map(add, f, drop(1, f))

assert list(take(10, fib)) == [0,1,1,2,3,5,8,13,21,34]
assert fib[20] == 6765
assert list(fib[30:35]) == [832040,1346269,2178309,3524578,5702887]

蹦床(Trampolines)修饰符

fn.recur.tco是一个不需要大量栈空间分配就可以处理TCO的临时方案。让我们先从一个递归阶乘计算示例开始:

def fact(n):
   if n == 0: return 1
   return n * fact(n-1)

这种方式也能工作,但实现非常糟糕。为什么呢?因为它会递归式地保存之前的计算值以算出最终结果,因此消耗了大量的存储空间。如果你对一个很大的n值(超过了sys.getrecursionlimit()的值)执行这个函数,CPython就会以此方式失败中止:

>>> import sys
>>> fact(sys.getrecursionlimit() * 2)
... many many lines of stacktrace ...
RuntimeError: maximum recursion depth exceeded

这也是件好事,至少它避免了在你的代码中产生严重错误。

我们如何优化这个方案呢?答案很简单,只需改变函数以使用尾递归即可:

def fact(n, acc=1):
   if n == 0: return acc
   return fact(n-1, acc*n)

为什么这种方式更佳呢?因为你不需要保留之前的值以计算出最终结果。可以在Wikipedia上查看更多尾递归调用优化的内容。可是……Python的解释器会用和之前函数相同的方式执行这段函数,结果是你没得到任何优化。

fn.recur.tco为你提供了一种机制,使你可以使用“蹦床”方式获得一定的尾递归优化。同样的方式也使用在诸如Clojure语言中,主要思路是将函数调用序列转换为while循环。

from fn import recur

@recur.tco 
def fact(n, acc=1):
   if n == 0: return False, acc
   return True, (n-1, acc*n)

@recur.tco是一个修饰符,能将你的函数执行转为while循环并检验其输出内容:

  •     (False, result)代表运行完毕
  •     (True, args, kwargs)代表我们要继续调用函数并传递不同的参数
  •     (func, args, kwargs)代表在while循环中切换要执行的函数

函数式风格的错误处理

假设你有一个Request类,可以按照传入其中的参数名称得到对应的值。要想让其返回值格式为全大写、非空并且去除头尾空格的字符串,你需要这样写:

class Request(dict):
   def parameter(self, name):
     return self.get(name, None)

r = Request(testing="Fixed", empty=" ")
param = r.parameter("testing")
if param is None:
   fixed = ""
else:   
   param = param.strip()
   if len(param) == 0:
     fixed = ""
   else:
    fixed = param.upper()

额,看上去有些古怪。用fn.monad.Option来修改你的代码吧,它代表了可选值,每个Option实例可代表一个Full或者Empty(这点也受到了Scala中Option的启发)。它为你编写长运算序列提供了简便的方法,并且去掉除了许多if/else语句块。

from operator import methodcaller
from fn.monad import optionable

class Request(dict):
   @optionable
   def parameter(self, name):
     return self.get(name, None)

r = Request(testing="Fixed", empty=" ")
fixed = r.parameter("testing") 
     .map(methodcaller("strip")) 
     .filter(len) 
     .map(methodcaller("upper")) 
     .get_or("")

fn.monad.Option.or_call是个便利的方法,它允许你进行多次调用尝试以完成计算。例如,你有一个Request类,它有type,mimetype和url等几个可选属性,你需要使用最少一个属性值以分析它的“request类型”:

from fn.monad import Option 

request = dict(url="face.png", mimetype="PNG") 
tp = Option \ 
     .from_value(request.get("type", None)) \ # check "type" key first 
     .or_call(from_mimetype, request) \ # or.. check "mimetype" key 
     .or_call(from_extension, request) \ # or... get "url" and check extension 
     .get_or("application/undefined")

其余事项?

我仅仅描述了类库的一小部分,你还能够找到并使用以下功能:

  •     22个附加的itertools代码段,以扩展内置module的功能的附加功能
  •     将Python 2和Python 3的迭代器(iterator)(如range,map及filtter等等)使用进行了统一,这对使用跨版本的类库时非常有用
  •     为函数式组合及partial函数应用提供了简便的语法
  •     为使用高阶函数(apply,flip等等)提供了附加的操作符

正在进行中的工作

自从在Github上发布这个类库以来,我从社区中收到了许多审校观点、意见和建议,以及补丁和修复。我也在继续增强现有功能,并提供新的特性。近期的路线图包括以下内容:

  •     为使用可迭代对象(iterable),如foldl,foldr增加更多操作符
  •     更多的monad,如fn.monad.Either,以处理错误记录
  •     为大多数module提供C-accelerator
  •     为简化lambda arg1: lambda arg2:…形式而提供的curry函数的生成器
  •     更多文档,更多测试,更多示例代码
Python 相关文章推荐
python处理文本文件并生成指定格式的文件
Jul 31 Python
利用Python实现颜色色值转换的小工具
Oct 27 Python
Python利用pandas计算多个CSV文件数据值的实例
Apr 19 Python
提升Python程序性能的7个习惯
Apr 14 Python
python验证身份证信息实例代码
May 06 Python
python openvc 裁剪、剪切图片 提取图片的行和列
Sep 19 Python
Python基于百度AI实现OCR文字识别
Apr 02 Python
使用pandas库对csv文件进行筛选保存
May 25 Python
简单了解Python变量作用域正确使用方法
Jun 12 Python
如何将json数据转换为python数据
Sep 04 Python
使用scrapy ImagesPipeline爬取图片资源的示例代码
Sep 28 Python
python自动化办公操作PPT的实现
Feb 05 Python
Python实现的数据结构与算法之基本搜索详解
Apr 22 #Python
Python实现的数据结构与算法之链表详解
Apr 22 #Python
Python实现的数据结构与算法之双端队列详解
Apr 22 #Python
Python实现的数据结构与算法之队列详解
Apr 22 #Python
详尽讲述用Python的Django框架测试驱动开发的教程
Apr 22 #Python
Hadoop中的Python框架的使用指南
Apr 22 #Python
Python实现提取文章摘要的方法
Apr 21 #Python
You might like
使用sockets:从新闻组中获取文章(三)
2006/10/09 PHP
让你同时上传 1000 个文件 (二)
2006/10/09 PHP
PHP测试程序运行时间的类
2012/02/05 PHP
Aster vs KG BO3 第三场2.19
2021/03/10 DOTA
XML的代替者----JSON
2007/07/21 Javascript
JS 动态获取节点代码innerHTML分析 [IE,FF]
2009/11/30 Javascript
jQuery动画效果-fadeIn fadeOut淡入浅出示例代码
2013/08/28 Javascript
jquery解析XML字符串和XML文件的方法说明
2014/02/21 Javascript
JavaScript中使用Object.prototype.toString判断是否为数组
2015/04/01 Javascript
AngularJS中watch监听用法分析
2016/11/04 Javascript
分类解析jQuery选择器
2016/11/23 Javascript
React Native中Navigator的使用方法示例
2017/10/13 Javascript
一个基于react的图片裁剪组件示例
2018/04/18 Javascript
vue.js中实现登录控制的方法示例
2018/04/23 Javascript
Vue中保存数据到磁盘文件的方法
2018/09/06 Javascript
小程序获取当前位置加搜索附近热门小区及商区的方法
2019/04/08 Javascript
vue中注册自定义的全局js方法
2019/11/15 Javascript
[17:13]DOTA2 HEROS教学视频教你分分钟做大人-斯拉克
2014/06/13 DOTA
Python实现Tab自动补全和历史命令管理的方法
2015/03/12 Python
python 爬虫出现403禁止访问错误详解
2017/03/11 Python
在Python中实现替换字符串中的子串的示例
2018/10/31 Python
python数值基础知识浅析
2019/11/19 Python
python如何绘制疫情图
2020/09/16 Python
python中四舍五入的正确打开方式
2021/01/18 Python
canvas实现圆形进度条动画的示例代码
2017/12/26 HTML / CSS
捷克原创男装和女装购物网站:Bolf.cz
2018/04/28 全球购物
蒂娜商店:Tiina the Store
2019/12/07 全球购物
Java中有几种方法可以实现一个线程?用什么关键字修饰同步方法?stop()和suspend()方法为何不推荐使用?
2015/08/04 面试题
委托公证书范本
2014/04/03 职场文书
家长会标语
2014/06/24 职场文书
2015年打非治违工作总结
2015/04/02 职场文书
企业战略合作意向书
2015/05/08 职场文书
三八节活动简报
2015/07/20 职场文书
python自动化八大定位元素讲解
2021/07/09 Python
关于MySQL中的 like操作符详情
2021/11/17 MySQL
SpringBoot前端后端分离之Nginx服务器下载安装过程
2022/08/14 Servers