六个窍门助你提高Python运行效率


Posted in Python onJune 09, 2015

不喜欢Python的人经常会吐嘈Python运行太慢。但是,事实并非如此。尝试以下六个窍门,来为你的Python应用提速。

窍门一:关键代码使用外部功能包

Python简化了许多编程任务,但是对于一些时间敏感的任务,它的表现经常不尽人意。使用C/C++或机器语言的外部功能包处理时间敏感任务,可以有效提高应用的运行效率。这些功能包往往依附于特定的平台,因此你要根据自己所用的平台选择合适的功能包。简而言之,这个窍门要你牺牲应用的可移植性以换取只有通过对底层主机的直接编程才能获得的运行效率。以下是一些你可以选择用来提升效率的功能包:

Cython
Pylnlne
PyPy
Pyrex

这些功能包的用处各有不同。比如说,使用C语言的数据类型,可以使涉及内存操作的任务更高效或者更直观。Pyrex就能帮助Python延展出这样的功能。Pylnline能使你在Python应用中直接使用C代码。内联代码是独立编译的,但是它把所有编译文件都保存在某处,并能充分利用C语言提供的高效率。

窍门二:在排序时使用键

Python含有许多古老的排序规则,这些规则在你创建定制的排序方法时会占用很多时间,而这些排序方法运行时也会拖延程序实际的运行速度。最佳的排序方法其实是尽可能多地使用键和内置的sort()方法。譬如,拿下面的代码来说:

    import operator

    somelist = [(1, 5, 8), (6, 2, 4), (9, 7, 5)]

    somelist.sort(key=operator.itemgetter(0))

    somelist

    #Output = [(1, 5, 8), (6, 2, 4), (9, 7, 5)]

    somelist.sort(key=operator.itemgetter(1))

    somelist

    #Output = [(6, 2, 4), (1, 5, 8), (9, 7, 5)]

    somelist.sort(key=operator.itemgetter(2))

    somelist

    #Output = [(6, 2, 4), (9, 7, 5), (1, 5, 8)],

在每段例子里,list都是根据你选择的用作关键参数的索引进行排序的。这个方法不仅对数值类型有效,还同样适用于字符串类型。

窍门三:针对循环的优化

每一种编程语言都强调最优化的循环方案。当使用Python时,你可以借助丰富的技巧让循环程序跑得更快。然而,开发者们经常遗忘的一个技巧是:尽量避免在循环中访问变量的属性。譬如,拿下面的代码来说:

    lowerlist = ['this', 'is', 'lowercase']

    upper = str.upper

    upperlist = []

    append = upperlist.append

    for word in lowerlist:

        append(upper(word))

        print(upperlist)

        #Output = ['THIS', 'IS', 'LOWERCASE']

每次你调用str.upper, Python都会计算这个式子的值。然而,如果你把这个求值赋值给一个变量,那么求值的结果就能提前知道,Python程序就能运行得更快。因此,关键就是尽可能减小Python在循环中的工作量。因为Python解释执行的特性,在上面的例子中会大大减慢它的速度。

(注意:优化循环的方法还有很多,这只是其中之一。比如,很多程序员会认为,列表推导式是提高循环速度的最佳方法。关键在于,优化循环方案是提高应用程序运行速度的上佳选择。)

窍门四:使用较新的Python版本

如果你在网上搜索Python,你会发现数不尽的信息都是关于如何升级Python版本。通常,每个版本的Python都会包含优化内容,使其运行速度优于之前的版本。但是,限制因素在于,你最喜欢的函数库有没有同步更新支持新的Python版本。与其争论函数库是否应该更新,关键在于新的Python版本是否足够高效来支持这一更新。

你要保证自己的代码在新版本里还能运行。你需要使用新的函数库才能体验新的Python版本,然后你需要在做出关键性的改动时检查自己的应用。只有当你完成必要的修正之后,你才能体会新版本的不同。

然而,如果你只是确保自己的应用在新版本中可以运行,你很可能会错过新版本提供的新特性。一旦你决定更新,请分析你的应用在新版本下的表现,并检查可能出问题的部分,然后优先针对这些部分应用新版本的特性。只有这样,用户才能在更新之初就觉察到应用性能的改观。

窍门五:尝试多种编码方法

每次创建应用时都使用同一种编码方法几乎无一例外会导致应用的运行效率不尽人意。可以在程序分析时尝试一些试验性的办法。譬如说,在处理字典中的数据项时,你既可以使用安全的方法,先确保数据项已经存在再进行更新,也可以直接对数据项进行更新,把不存在的数据项作为特例分开处理。请看下面第一段代码:

   n = 16

    myDict = {}

    for i in range(0, n):

        char = 'abcd'[i%4]

        if char not in myDict:

            myDict[char] = 0

            myDict[char] += 1

            print(myDict)

当一开始myDict为空时,这段代码会跑得比较快。然而,通常情况下,myDict填满了数据,至少填有大部分数据,这时换另一种方法会更有效率。

    n = 16

    myDict = {}

    for i in range(0, n):

        char = 'abcd'[i%4]

        try:

            myDict[char] += 1

        except KeyError:

            myDict[char] = 1

        print(myDict)

在两种方法中输出结果都是一样的。区别在于输出是如何获得的。跳出常规的思维模式,创建新的编程技巧能使你的应用更有效率。

窍门六:交叉编译你的应用

开发者有时会忘记计算机其实并不理解用来创建现代应用程序的编程语言。计算机理解的是机器语言。为了运行你的应用,你借助一个应用将你所编的人类可读的代码转换成机器可读的代码。有时,你用一种诸如Python这样的语言编写应用,再以C++这样的语言运行你的应用,这在运行的角度来说,是可行的。关键在于,你想你的应用完成什么事情,而你的主机系统能提供什么样的资源。

Nuitka是一款有趣的交叉编译器,能将你的Python代码转化成C++代码。这样,你就可以在native模式下执行自己的应用,而无需依赖于解释器程序。你会发现自己的应用运行效率有了较大的提高,但是这会因平台和任务的差异而有所不同。

(注意:Nuitka现在还处在测试阶段,所以在实际应用中请多加注意。实际上,当下最好还是把它用于实验。此外,关于交叉编译是否为提高运行效率的最佳方法还存在讨论的空间。开发者已经使用交叉编译多年,用来提高应用的速度。记住,每一种解决办法都有利有弊,在把它用于生产环境之前请仔细权衡。)

在使用交叉编译器时,记得确保它支持你所用的Python版本。Nuitka支持Python2.6, 2.7, 3.2和3.3。为了让解决方案生效,你需要一个Python解释器和一个C++编译器。Nuitka支持许多C++编译器,其中包括Microsoft Visual Studio, MinGW 和 Clang/LLVM。

交叉编译可能造成一些严重问题。比如,在使用Nuitka时,你会发现即便是一个小程序也会消耗巨大的驱动空间。因为Nuitka借助一系列的动态链接库(DDLs)来执行Python的功能。因此,如果你用的是一个资源很有限的系统,这种方法或许不太可行。

结论

前文所述的六个窍门都能帮助你创建运行更有效率的Python应用。但是银弹是不存在的。上述的这些窍门不一定每次都能奏效。在特定的Python的版本下,有的窍门或许比其他的表现更好,但这有时候甚至取决于平台的差异。你需要总结分析你的应用,找到它效率低下的部分,然后尝试这些窍门,找到解决问题的最佳方法。

Python 相关文章推荐
Python列表计数及插入实例
Dec 17 Python
Python打印斐波拉契数列实例
Jul 07 Python
Pycharm学习教程(6) Pycharm作为Vim编辑器使用
May 03 Python
Python基础知识_浅谈用户交互
May 31 Python
2018年Python值得关注的开源库、工具和开发者(总结篇)
Jan 04 Python
Python基于百度云文字识别API
Dec 13 Python
Python模块 _winreg操作注册表
Feb 05 Python
python读取多层嵌套文件夹中的文件实例
Feb 27 Python
Python基于class()实现面向对象原理详解
Mar 26 Python
python传到前端的数据,双引号被转义的问题
Apr 03 Python
python 使用事件对象asyncio.Event来同步协程的操作
May 04 Python
基于Python的图像阈值化分割(迭代法)
Nov 20 Python
python数组复制拷贝的实现方法
Jun 09 #Python
Python函数返回值实例分析
Jun 08 #Python
python下MySQLdb用法实例分析
Jun 08 #Python
Python赋值语句后逗号的作用分析
Jun 08 #Python
Python中逗号的三种作用实例分析
Jun 08 #Python
Python文件右键找不到IDLE打开项解决办法
Jun 08 #Python
Python判断字符串与大小写转换
Jun 08 #Python
You might like
通过PHP CLI实现简单的数据库实时监控调度
2009/07/01 PHP
PHP输入流php://input介绍
2012/09/18 PHP
php根据日期判断星座的函数分享
2014/02/13 PHP
Laravel使用Caching缓存数据减轻数据库查询压力的方法
2016/03/15 PHP
PHP实现数组array转换成xml的方法
2016/07/19 PHP
Javascript 写的简单进度条控件
2008/01/22 Javascript
JavaScript.Encode手动解码技巧
2010/07/14 Javascript
JQuery浮动DIV提示信息并自动隐藏的代码
2010/08/29 Javascript
js判断输入是否为正整数、浮点数等数字的函数代码
2010/11/17 Javascript
25个非常棒的jQuery滑块插件和教程小结
2011/09/02 Javascript
Javascript实现DIV滚动自动滚动到底部的代码
2012/03/01 Javascript
可选择和输入的下拉列表框示例
2013/11/05 Javascript
JS通过分析userAgent属性来判断浏览器的类型及版本
2014/03/28 Javascript
浅谈JavaScript中的String对象常用方法
2015/02/25 Javascript
JQuery中绑定事件(bind())和移除事件(unbind())
2015/02/27 Javascript
Augularjs-起步详解
2016/07/08 Javascript
AngularJS 所有版本下载地址
2016/09/14 Javascript
微信小程序 Template详解及简单实例
2017/01/05 Javascript
[01:00:26]Ti4主赛事胜者组第一天 EG vs NEWBEE 1
2014/07/19 DOTA
python kmeans聚类简单介绍和实现代码
2018/02/23 Python
Python基于win32ui模块创建弹出式菜单示例
2018/05/09 Python
python利用7z批量解压rar的实现
2019/08/07 Python
Python Django 命名空间模式的实现
2019/08/09 Python
nginx+uwsgi+django环境搭建的方法步骤
2019/11/25 Python
分布式全文检索引擎ElasticSearch原理及使用实例
2020/11/14 Python
使用Python通过oBIX协议访问Niagara数据的示例
2020/12/04 Python
IE8下CSS3选择器nth-child() 不兼容问题的解决方法
2016/11/16 HTML / CSS
IE支持HTML5的解决方法
2009/10/20 HTML / CSS
大学系主任推荐信范文
2013/12/24 职场文书
环保公益广告语
2014/03/13 职场文书
四群教育工作实施方案
2014/03/26 职场文书
庆祝国庆节演讲稿2014
2014/09/19 职场文书
党员对照检查剖析材料
2014/10/13 职场文书
中班上学期个人总结
2015/02/12 职场文书
银行实习推荐信
2015/03/27 职场文书
Django+Celery实现定时任务的示例
2021/06/23 Python