利用Fn.py库在Python中进行函数式编程


Posted in Python onApril 22, 2015

尽管Python事实上并不是一门纯函数式编程语言,但它本身是一门多范型语言,并给了你足够的自由利用函数式编程的便利。函数式风格有着各种理论与实际上的好处(你可以在Python的文档中找到这个列表):

  •     形式上可证
  •     模块性
  •     组合性
  •     易于调试及测试

虽然这份列表已经描述得够清楚了,但我还是很喜欢Michael O.Church在他的文章“函数式程序极少腐坏(Functional programs rarely rot)”中对函数式编程的优点所作的描述。我在PyCon UA 2012期间的讲座“Functional Programming with Python”中谈论了在Python中使用函数式方式的内容。我也提到,在你尝试在Python中编写可读同时又可维护的函数式代码时,你会很快发现诸多问题。

fn.py类库就是为了应对这些问题而诞生的。尽管它不可能解决所有问题,但对于希望从函数式编程方式中获取最大价值的开发者而言,它是一块“电池”,即使是在命令式方式占主导地位的程序中,也能够发挥作用。那么,它里面都有些什么呢?
Scala风格的Lambda定义

在Python中创建Lambda函数的语法非常冗长,来比较一下:

Python

map(lambda x: x*2, [1,2,3])

Scala

List(1,2,3).map(_*2)

Clojure

(map #(* % 2) '(1 2 3))

Haskell

map (2*) [1,2,3]

受Scala的启发,Fn.py提供了一个特别的_对象以简化Lambda语法。

from fn import _

assert (_ + _)(10, 5) = 15
assert list(map(_ * 2, range(5))) == [0,2,4,6,8]
assert list(filter(_ < 10, [9,10,11])) == [9]

除此之外还有许多场景可以使用_:所有的算术操作、属性解析、方法调用及分片算法。如果你不确定你的函数具体会做些什么,你可以将结果打印出来:

from fn import _ 

print (_ + 2) # "(x1) => (x1 + 2)" 
print (_ + _ * _) # "(x1, x2, x3) => (x1 + (x2 * x3))"

流(Stream)及无限序列的声明

Scala风格的惰性求值(Lazy-evaluated)流。其基本思路是:对每个新元素“按需”取值,并在所创建的全部迭代中共享计算出的元素值。Stream对象支持<<操作符,代表在需要时将新元素推入其中。

惰性求值流对无限序列的处理是一个强大的抽象。我们来看看在函数式编程语言中如何计算一个斐波那契序列。

Haskell

fibs = 0 : 1 : zipWith (+) fibs (tail fibs)

Clojure

(def fib (lazy-cat [0 1] (map + fib (rest fib))))

Scala

def fibs: Stream[Int] = 

     0 #:: 1 #:: fibs.zip(fibs.tail).map{case (a,b) => a + b}

现在你可以在Python中使用同样的方式了:

from fn import Stream 
from fn.iters import take, drop, map
from operator import add

f = Stream()
fib = f << [0, 1] << map(add, f, drop(1, f))

assert list(take(10, fib)) == [0,1,1,2,3,5,8,13,21,34]
assert fib[20] == 6765
assert list(fib[30:35]) == [832040,1346269,2178309,3524578,5702887]

蹦床(Trampolines)修饰符

fn.recur.tco是一个不需要大量栈空间分配就可以处理TCO的临时方案。让我们先从一个递归阶乘计算示例开始:

def fact(n):
   if n == 0: return 1
   return n * fact(n-1)

这种方式也能工作,但实现非常糟糕。为什么呢?因为它会递归式地保存之前的计算值以算出最终结果,因此消耗了大量的存储空间。如果你对一个很大的n值(超过了sys.getrecursionlimit()的值)执行这个函数,CPython就会以此方式失败中止:

>>> import sys
>>> fact(sys.getrecursionlimit() * 2)
... many many lines of stacktrace ...
RuntimeError: maximum recursion depth exceeded

这也是件好事,至少它避免了在你的代码中产生严重错误。

我们如何优化这个方案呢?答案很简单,只需改变函数以使用尾递归即可:

def fact(n, acc=1):
   if n == 0: return acc
   return fact(n-1, acc*n)

为什么这种方式更佳呢?因为你不需要保留之前的值以计算出最终结果。可以在Wikipedia上查看更多尾递归调用优化的内容。可是……Python的解释器会用和之前函数相同的方式执行这段函数,结果是你没得到任何优化。

fn.recur.tco为你提供了一种机制,使你可以使用“蹦床”方式获得一定的尾递归优化。同样的方式也使用在诸如Clojure语言中,主要思路是将函数调用序列转换为while循环。

from fn import recur

@recur.tco 
def fact(n, acc=1):
   if n == 0: return False, acc
   return True, (n-1, acc*n)

@recur.tco是一个修饰符,能将你的函数执行转为while循环并检验其输出内容:

  •     (False, result)代表运行完毕
  •     (True, args, kwargs)代表我们要继续调用函数并传递不同的参数
  •     (func, args, kwargs)代表在while循环中切换要执行的函数

函数式风格的错误处理

假设你有一个Request类,可以按照传入其中的参数名称得到对应的值。要想让其返回值格式为全大写、非空并且去除头尾空格的字符串,你需要这样写:

class Request(dict):
   def parameter(self, name):
     return self.get(name, None)

r = Request(testing="Fixed", empty=" ")
param = r.parameter("testing")
if param is None:
   fixed = ""
else:   
   param = param.strip()
   if len(param) == 0:
     fixed = ""
   else:
    fixed = param.upper()

额,看上去有些古怪。用fn.monad.Option来修改你的代码吧,它代表了可选值,每个Option实例可代表一个Full或者Empty(这点也受到了Scala中Option的启发)。它为你编写长运算序列提供了简便的方法,并且去掉除了许多if/else语句块。

from operator import methodcaller
from fn.monad import optionable

class Request(dict):
   @optionable
   def parameter(self, name):
     return self.get(name, None)

r = Request(testing="Fixed", empty=" ")
fixed = r.parameter("testing") 
     .map(methodcaller("strip")) 
     .filter(len) 
     .map(methodcaller("upper")) 
     .get_or("")

fn.monad.Option.or_call是个便利的方法,它允许你进行多次调用尝试以完成计算。例如,你有一个Request类,它有type,mimetype和url等几个可选属性,你需要使用最少一个属性值以分析它的“request类型”:

from fn.monad import Option 

request = dict(url="face.png", mimetype="PNG") 
tp = Option \ 
     .from_value(request.get("type", None)) \ # check "type" key first 
     .or_call(from_mimetype, request) \ # or.. check "mimetype" key 
     .or_call(from_extension, request) \ # or... get "url" and check extension 
     .get_or("application/undefined")

其余事项?

我仅仅描述了类库的一小部分,你还能够找到并使用以下功能:

  •     22个附加的itertools代码段,以扩展内置module的功能的附加功能
  •     将Python 2和Python 3的迭代器(iterator)(如range,map及filtter等等)使用进行了统一,这对使用跨版本的类库时非常有用
  •     为函数式组合及partial函数应用提供了简便的语法
  •     为使用高阶函数(apply,flip等等)提供了附加的操作符

正在进行中的工作

自从在Github上发布这个类库以来,我从社区中收到了许多审校观点、意见和建议,以及补丁和修复。我也在继续增强现有功能,并提供新的特性。近期的路线图包括以下内容:

  •     为使用可迭代对象(iterable),如foldl,foldr增加更多操作符
  •     更多的monad,如fn.monad.Either,以处理错误记录
  •     为大多数module提供C-accelerator
  •     为简化lambda arg1: lambda arg2:…形式而提供的curry函数的生成器
  •     更多文档,更多测试,更多示例代码
Python 相关文章推荐
Python sys.path详细介绍
Oct 17 Python
python新手经常遇到的17个错误分析
Jul 30 Python
Python实现遍历数据库并获取key的值
May 17 Python
在win和Linux系统中python命令行运行的不同
Jul 03 Python
详解用Python处理HTML转义字符的5种方式
Dec 27 Python
python实现学生信息管理系统
Apr 05 Python
python spyder中读取txt为图片的方法
Apr 27 Python
python组合无重复三位数的实例
Nov 13 Python
详解利用OpenCV提取图像中的矩形区域(PPT屏幕等)
Jul 01 Python
Python virtualenv虚拟环境实现过程解析
Apr 18 Python
Android Q之气泡弹窗的实现示例
Jun 23 Python
python对输出的奇数偶数排序实例代码
Dec 04 Python
Python实现的数据结构与算法之基本搜索详解
Apr 22 #Python
Python实现的数据结构与算法之链表详解
Apr 22 #Python
Python实现的数据结构与算法之双端队列详解
Apr 22 #Python
Python实现的数据结构与算法之队列详解
Apr 22 #Python
详尽讲述用Python的Django框架测试驱动开发的教程
Apr 22 #Python
Hadoop中的Python框架的使用指南
Apr 22 #Python
Python实现提取文章摘要的方法
Apr 21 #Python
You might like
PHP实现用户认证及管理完全源码
2007/03/11 PHP
php pack与unpack 摸板字符字符含义
2009/10/29 PHP
PHP array_multisort() 函数的深入解析
2013/06/20 PHP
PHP中使用sleep函数实现定时任务实例分享
2014/08/21 PHP
正确的PHP匹配UTF-8中文的正则表达式
2015/05/13 PHP
ThinkPHP中使用Ueditor富文本编辑器
2015/09/02 PHP
Symfony控制层深入详解
2016/03/17 PHP
PHP简单实现生成txt文件到指定目录的方法
2016/04/25 PHP
jquery实现的可隐藏重现的靠边悬浮层实例代码
2013/05/27 Javascript
jquery实现简单的拖拽效果实例兼容所有主流浏览器(优化篇)
2013/06/28 Javascript
Javascript倒计时页面跳转实例小结
2013/09/11 Javascript
js格式化时间和js格式化时间戳示例
2014/02/10 Javascript
javascript中数组的定义及使用实例
2015/01/21 Javascript
JavaScript中解析JSON数据的三种方法
2015/07/03 Javascript
JQUERY的AJAX请求缓存里的数据问题处理
2016/02/23 Javascript
Bootstrap table使用方法总结
2017/05/10 Javascript
js实现移动端导航点击自动滑动效果
2017/07/18 Javascript
ES6解构赋值的功能与用途实例分析
2017/10/31 Javascript
vue实现点击当前标签高亮效果【推荐】
2018/06/22 Javascript
Vue中保存数据到磁盘文件的方法
2018/09/06 Javascript
vue-video-player实现实时视频播放方式(监控设备-rtmp流)
2020/08/10 Javascript
Vue实现菜单切换功能
2020/11/08 Javascript
python统计文本文件内单词数量的方法
2015/05/30 Python
Python中index()和seek()的用法(详解)
2017/04/27 Python
今天 平安夜 Python 送你一顶圣诞帽 @微信官方
2017/12/25 Python
python 限制函数执行时间,自己实现timeout的实例
2019/01/12 Python
在pycharm中设置显示行数的方法
2019/01/16 Python
关于Python核心框架tornado的异步协程的2种方法详解
2019/08/28 Python
python判断变量是否为列表的方法
2020/09/17 Python
Django2.1.7 查询数据返回json格式的实现
2020/12/29 Python
德国购买健身器材:AsVIVA
2017/08/09 全球购物
const char*, char const*, char*const的区别是什么
2014/07/09 面试题
中学生检讨书1000字
2014/10/28 职场文书
经营场所使用证明
2015/06/19 职场文书
北京大学中文系教授推荐的10本小说
2019/08/08 职场文书
浅谈MySQL之select优化方案
2021/08/07 MySQL