六个窍门助你提高Python运行效率


Posted in Python onJune 09, 2015

不喜欢Python的人经常会吐嘈Python运行太慢。但是,事实并非如此。尝试以下六个窍门,来为你的Python应用提速。

窍门一:关键代码使用外部功能包

Python简化了许多编程任务,但是对于一些时间敏感的任务,它的表现经常不尽人意。使用C/C++或机器语言的外部功能包处理时间敏感任务,可以有效提高应用的运行效率。这些功能包往往依附于特定的平台,因此你要根据自己所用的平台选择合适的功能包。简而言之,这个窍门要你牺牲应用的可移植性以换取只有通过对底层主机的直接编程才能获得的运行效率。以下是一些你可以选择用来提升效率的功能包:

Cython
Pylnlne
PyPy
Pyrex

这些功能包的用处各有不同。比如说,使用C语言的数据类型,可以使涉及内存操作的任务更高效或者更直观。Pyrex就能帮助Python延展出这样的功能。Pylnline能使你在Python应用中直接使用C代码。内联代码是独立编译的,但是它把所有编译文件都保存在某处,并能充分利用C语言提供的高效率。

窍门二:在排序时使用键

Python含有许多古老的排序规则,这些规则在你创建定制的排序方法时会占用很多时间,而这些排序方法运行时也会拖延程序实际的运行速度。最佳的排序方法其实是尽可能多地使用键和内置的sort()方法。譬如,拿下面的代码来说:

    import operator

    somelist = [(1, 5, 8), (6, 2, 4), (9, 7, 5)]

    somelist.sort(key=operator.itemgetter(0))

    somelist

    #Output = [(1, 5, 8), (6, 2, 4), (9, 7, 5)]

    somelist.sort(key=operator.itemgetter(1))

    somelist

    #Output = [(6, 2, 4), (1, 5, 8), (9, 7, 5)]

    somelist.sort(key=operator.itemgetter(2))

    somelist

    #Output = [(6, 2, 4), (9, 7, 5), (1, 5, 8)],

在每段例子里,list都是根据你选择的用作关键参数的索引进行排序的。这个方法不仅对数值类型有效,还同样适用于字符串类型。

窍门三:针对循环的优化

每一种编程语言都强调最优化的循环方案。当使用Python时,你可以借助丰富的技巧让循环程序跑得更快。然而,开发者们经常遗忘的一个技巧是:尽量避免在循环中访问变量的属性。譬如,拿下面的代码来说:

    lowerlist = ['this', 'is', 'lowercase']

    upper = str.upper

    upperlist = []

    append = upperlist.append

    for word in lowerlist:

        append(upper(word))

        print(upperlist)

        #Output = ['THIS', 'IS', 'LOWERCASE']

每次你调用str.upper, Python都会计算这个式子的值。然而,如果你把这个求值赋值给一个变量,那么求值的结果就能提前知道,Python程序就能运行得更快。因此,关键就是尽可能减小Python在循环中的工作量。因为Python解释执行的特性,在上面的例子中会大大减慢它的速度。

(注意:优化循环的方法还有很多,这只是其中之一。比如,很多程序员会认为,列表推导式是提高循环速度的最佳方法。关键在于,优化循环方案是提高应用程序运行速度的上佳选择。)

窍门四:使用较新的Python版本

如果你在网上搜索Python,你会发现数不尽的信息都是关于如何升级Python版本。通常,每个版本的Python都会包含优化内容,使其运行速度优于之前的版本。但是,限制因素在于,你最喜欢的函数库有没有同步更新支持新的Python版本。与其争论函数库是否应该更新,关键在于新的Python版本是否足够高效来支持这一更新。

你要保证自己的代码在新版本里还能运行。你需要使用新的函数库才能体验新的Python版本,然后你需要在做出关键性的改动时检查自己的应用。只有当你完成必要的修正之后,你才能体会新版本的不同。

然而,如果你只是确保自己的应用在新版本中可以运行,你很可能会错过新版本提供的新特性。一旦你决定更新,请分析你的应用在新版本下的表现,并检查可能出问题的部分,然后优先针对这些部分应用新版本的特性。只有这样,用户才能在更新之初就觉察到应用性能的改观。

窍门五:尝试多种编码方法

每次创建应用时都使用同一种编码方法几乎无一例外会导致应用的运行效率不尽人意。可以在程序分析时尝试一些试验性的办法。譬如说,在处理字典中的数据项时,你既可以使用安全的方法,先确保数据项已经存在再进行更新,也可以直接对数据项进行更新,把不存在的数据项作为特例分开处理。请看下面第一段代码:

   n = 16

    myDict = {}

    for i in range(0, n):

        char = 'abcd'[i%4]

        if char not in myDict:

            myDict[char] = 0

            myDict[char] += 1

            print(myDict)

当一开始myDict为空时,这段代码会跑得比较快。然而,通常情况下,myDict填满了数据,至少填有大部分数据,这时换另一种方法会更有效率。

    n = 16

    myDict = {}

    for i in range(0, n):

        char = 'abcd'[i%4]

        try:

            myDict[char] += 1

        except KeyError:

            myDict[char] = 1

        print(myDict)

在两种方法中输出结果都是一样的。区别在于输出是如何获得的。跳出常规的思维模式,创建新的编程技巧能使你的应用更有效率。

窍门六:交叉编译你的应用

开发者有时会忘记计算机其实并不理解用来创建现代应用程序的编程语言。计算机理解的是机器语言。为了运行你的应用,你借助一个应用将你所编的人类可读的代码转换成机器可读的代码。有时,你用一种诸如Python这样的语言编写应用,再以C++这样的语言运行你的应用,这在运行的角度来说,是可行的。关键在于,你想你的应用完成什么事情,而你的主机系统能提供什么样的资源。

Nuitka是一款有趣的交叉编译器,能将你的Python代码转化成C++代码。这样,你就可以在native模式下执行自己的应用,而无需依赖于解释器程序。你会发现自己的应用运行效率有了较大的提高,但是这会因平台和任务的差异而有所不同。

(注意:Nuitka现在还处在测试阶段,所以在实际应用中请多加注意。实际上,当下最好还是把它用于实验。此外,关于交叉编译是否为提高运行效率的最佳方法还存在讨论的空间。开发者已经使用交叉编译多年,用来提高应用的速度。记住,每一种解决办法都有利有弊,在把它用于生产环境之前请仔细权衡。)

在使用交叉编译器时,记得确保它支持你所用的Python版本。Nuitka支持Python2.6, 2.7, 3.2和3.3。为了让解决方案生效,你需要一个Python解释器和一个C++编译器。Nuitka支持许多C++编译器,其中包括Microsoft Visual Studio, MinGW 和 Clang/LLVM。

交叉编译可能造成一些严重问题。比如,在使用Nuitka时,你会发现即便是一个小程序也会消耗巨大的驱动空间。因为Nuitka借助一系列的动态链接库(DDLs)来执行Python的功能。因此,如果你用的是一个资源很有限的系统,这种方法或许不太可行。

结论

前文所述的六个窍门都能帮助你创建运行更有效率的Python应用。但是银弹是不存在的。上述的这些窍门不一定每次都能奏效。在特定的Python的版本下,有的窍门或许比其他的表现更好,但这有时候甚至取决于平台的差异。你需要总结分析你的应用,找到它效率低下的部分,然后尝试这些窍门,找到解决问题的最佳方法。

Python 相关文章推荐
python选择排序算法的实现代码
Nov 21 Python
使用graphics.py实现2048小游戏
Mar 10 Python
python之matplotlib学习绘制动态更新图实例代码
Jan 23 Python
Django的HttpRequest和HttpResponse对象详解
Jan 26 Python
python的dataframe和matrix的互换方法
Apr 11 Python
使用python判断你是青少年还是老年人
Nov 29 Python
python批量从es取数据的方法(文档数超过10000)
Dec 27 Python
Python标准库itertools的使用方法
Jan 17 Python
TensorFlow加载模型时出错的解决方式
Feb 06 Python
Python如何将函数值赋给变量
Apr 28 Python
Python select及selectors模块概念用法详解
Jun 22 Python
详解python网络进程
Jun 15 Python
python数组复制拷贝的实现方法
Jun 09 #Python
Python函数返回值实例分析
Jun 08 #Python
python下MySQLdb用法实例分析
Jun 08 #Python
Python赋值语句后逗号的作用分析
Jun 08 #Python
Python中逗号的三种作用实例分析
Jun 08 #Python
Python文件右键找不到IDLE打开项解决办法
Jun 08 #Python
Python判断字符串与大小写转换
Jun 08 #Python
You might like
PHP生成随机用户名和密码的实现代码
2013/02/27 PHP
php设计模式之单例模式使用示例
2014/01/20 PHP
PHP实现上传图片到 zimg 服务器
2016/10/19 PHP
CodeIgniter开发实现支付宝接口调用的方法示例
2016/11/14 PHP
php+ajax实现仿百度查询下拉内容功能示例
2017/10/20 PHP
让whoops帮我们告别ThinkPHP6的异常页面
2020/03/02 PHP
Javascript数组的排序 sort()方法和reverse()方法
2012/06/04 Javascript
jquery单行文字向上滚动效果示例
2014/03/06 Javascript
jQuery延迟加载图片插件Lazy Load使用指南
2015/03/25 Javascript
Jquery解析json字符串及json数组的方法
2015/05/29 Javascript
JS实现适合于后台使用的动画折叠菜单效果
2015/09/21 Javascript
vue的无缝滚动组件vue-seamless-scroll实例
2017/12/18 Javascript
vue-router 源码实现前端路由的两种方式
2018/07/02 Javascript
vue同步父子组件和异步父子组件的生命周期顺序问题
2018/10/07 Javascript
JavaScript enum枚举类型定义及使用方法
2020/05/15 Javascript
浅谈vue中document.getElementById()拿到的是原值的问题
2020/07/26 Javascript
python实现telnet客户端的方法
2015/04/15 Python
Python变量作用范围实例分析
2015/07/07 Python
Python 高级专用类方法的实例详解
2017/09/11 Python
解决pycharm运行程序出现卡住scanning files to index索引的问题
2019/06/27 Python
Ubuntu16.04安装python3.6.5步骤详解
2020/01/10 Python
python机器学习库xgboost的使用
2020/01/20 Python
python GUI库图形界面开发之PyQt5拖放控件实例详解
2020/02/25 Python
详解Pandas 处理缺失值指令大全
2020/07/30 Python
基于IE10/HTML5 开发
2013/04/22 HTML / CSS
浅谈HTML5 & CSS3的新交互特性
2016/07/19 HTML / CSS
Java中的基本数据类型所占存储空间大小固定的吗
2012/02/15 面试题
无工作经验者个人求职信范文
2013/12/22 职场文书
七年级音乐教学反思
2014/01/26 职场文书
司马光教学反思
2014/02/01 职场文书
2014年商场超市庆元旦活动方案
2014/02/14 职场文书
篮球比赛拉拉队口号
2014/06/10 职场文书
学习党的群众路线对照检查材料
2014/09/29 职场文书
运动会班级口号霸气押韵
2015/12/24 职场文书
TV动画「神渣☆爱豆」公开第一弹主视觉图
2022/03/21 日漫
MySQL去除密码登录告警的方法
2022/04/20 MySQL