机器学习的框架偏向于Python的13个原因


Posted in Python onDecember 07, 2017

13个机器学习的框架偏向于Python的原因,供大家参考,具体内容如下

机器学习的框架偏向于Python的13个原因

前言

主要有以下原因:

1. Python是解释语言,程序写起来非常方便

写程序方便对做机器学习的人很重要。
因为经常需要对模型进行各种各样的修改,这在编译语言里很可能是牵一发而动全身的事情,Python里通常可以用很少的时间实现。

举例来说,在C等编译语言里写一个矩阵乘法,需要自己分配操作数(矩阵)的内存、分配结果的内存、手动对BLAS接口调用gemm、最后如果没用smart pointer还得手动回收内存空间。Python几乎就是import numpy; numpy.dot两句话的事。

当然现在很多面向C/C++库已经支持托管的内存管理了,这也让开发过程容易了很多,但解释语言仍然有天生的优势——不需要编译时间。这对机器学习这种需要大量prototyping和迭代的研究方向是非常有益工作效率的。

2. Python的开发生态成熟,有很多有用的库可以用

除了上面说到的NumPy,还有SciPy、NLTK、os(自带)等等不一而足。Python灵活的语法还使得包括文本操作、list/dict comprehension等非常实用的功能非常容易高效实现(编写和运行效率都高),配合lambda等使用更是方便。这也是Python良性生态背后的一大原因。相比而言,Lua虽然也是解释语言,甚至有LuaJIT这种神器加持,但其本身很难做到Python这样,一是因为有Python这个前辈占领着市场份额,另一个也因为它本身种种反常识的设计(比如全局变量)。不过借着Lua-Python bridge和Torch的东风,Lua似乎也在寄生兴起。

3. Python的效率很高。

解释语言的发展已经大大超过许多人的想象。很多比如list comprehension的语法糖都是贴近内核实现的。除了JIT[1]之外,还有Cython可以大幅增加运行效率。最后,得益于Python对C的接口,很多像gnumpy, theano这样高效、Python接口友好的库可以加速程序的运行,在强大团队的支撑下,这些库的效率可能比一个不熟练的程序员用C写一个月调优的效率还要高。

4.数据存储方便

有sql,hadoop,mangodb,redis,spark等

5.数据获取方便

有Scrapy,beautifulsoup,requests,paramiko等

6.数据运算方便

有pandas,Numpy,scipy等

7.输出结果方便

有matplotlib,VisPy等

8.和其他语言交互方便

有ctypes,rpy2,Cython,SWIG,PyQt,boost.python

9.加速方便

有pypy,Cython,PyCUDA

10.图形图像方便

有PyOpenGL,PyOpenCV,mayavi2

11.信号处理方便

PyWavelets,scipy.signal

12.云系统支持方便

github,sourceforge,EC2,BAT,HPC

13.python开源

python支持的平台多,包括windows,linux,unix,macos。而matlab太贵,只能调用其api,用python省钱,省钱就是赚钱。
python 和 c++ 做个比较。

c++ 的cpu效率是远远高于 python 的.不过 python 是一门胶水语言,它可以和任何语言结合,基于这个优点,很多数据处理的python 库底层都是 c++ 实现的,意思就是说:你用python写code,但效率是c++的。只有那些for 循环,还是用python的效率高。

近年来机器学习最要是深度学习,而深度学习使用cuda gpu加速远比cpu要快,而cuda 是c++写的。
所以现在TensorLayer、theano 等深度学习库都是 python 编程、底层c++。

相关书籍推荐:

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
用python删除java文件头上版权信息的方法
Jul 31 Python
Python可变参数函数用法实例
Jul 07 Python
Python处理CSV与List的转换方法
Apr 19 Python
PyCharm配置mongo插件的方法
Nov 30 Python
Django管理员账号和密码忘记的完美解决方法
Dec 06 Python
Python切片操作去除字符串首尾的空格
Apr 22 Python
Python 实现数组相减示例
Dec 27 Python
python实现密码强度校验
Mar 18 Python
Kmeans均值聚类算法原理以及Python如何实现
Sep 26 Python
Django启动时找不到mysqlclient问题解决方案
Nov 11 Python
如何用python实现一个HTTP连接池
Jan 14 Python
OpenCV项目实践之停车场车位实时检测
Apr 11 Python
python编程线性回归代码示例
Dec 07 #Python
基于Django的ModelForm组件(详解)
Dec 07 #Python
利用python编写一个图片主色转换的脚本
Dec 07 #Python
python八大排序算法速度实例对比
Dec 06 #Python
Python语言实现将图片转化为html页面
Dec 06 #Python
Python实现比较扑克牌大小程序代码示例
Dec 06 #Python
Python3简单实例计算同花的概率代码
Dec 06 #Python
You might like
一些星际专用术语解释
2020/03/04 星际争霸
window+nginx+php环境配置 附配置搭配说明
2010/12/29 PHP
PHP 安全检测代码片段(分享)
2013/07/05 PHP
关于URL最大长度限制的相关资料查证
2014/12/23 PHP
Yii框架组件和事件行为管理详解
2016/05/20 PHP
php数据结构之顺序链表与链式线性表示例
2018/01/22 PHP
php常用日期时间函数实例小结
2019/07/04 PHP
php array_chunk()函数用法与注意事项
2019/07/12 PHP
extjs 的权限问题 要求控制的对象是 菜单,按钮,URL
2010/03/09 Javascript
解析John Resig Simple JavaScript Inheritance代码
2012/12/03 Javascript
jQuery Migrate 1.1.0 Released 注意事项
2014/06/14 Javascript
jquery mobile页面跳转后样式丢失js失效的解决方法
2014/09/06 Javascript
angularjs中的e2e测试实例
2014/12/06 Javascript
jQuery循环动画与获取组件尺寸的方法
2015/02/02 Javascript
js事件监听器用法实例详解
2015/06/01 Javascript
JavaScript模拟实现键盘打字效果
2015/06/29 Javascript
AngularJS入门教程之控制器详解
2016/07/27 Javascript
JSON在Javascript中的使用(eval和JSON.parse的区别)详细解析
2017/09/05 Javascript
原生js实现碰撞检测
2020/03/12 Javascript
[32:26]EG vs IG 2018国际邀请赛小组赛BO2 第一场 8.16
2018/08/17 DOTA
[01:01:36]Optic vs paiN 2018国际邀请赛小组赛BO2 第一场 8.19
2018/08/21 DOTA
Python中map,reduce,filter和sorted函数的使用方法
2015/08/17 Python
windows下cx_Freeze生成Python可执行程序的详细步骤
2018/10/09 Python
python中bytes和str类型的区别
2019/10/21 Python
python使用yaml 管理selenium元素的示例
2020/12/01 Python
Pycharm 解决自动格式化冲突的设置操作
2021/01/15 Python
python 爬取腾讯视频评论的实现步骤
2021/02/18 Python
英国儿童设计师服装和玩具购物网站:Zac & Lulu
2020/10/19 全球购物
运动会广播稿200字
2014/01/15 职场文书
《争吵》教学反思
2014/02/15 职场文书
资源工程专业毕业生求职信
2014/02/27 职场文书
工商行政管理专业求职书
2014/05/23 职场文书
幼儿园社区活动总结
2014/07/07 职场文书
船舶工程技术专业求职信
2014/08/07 职场文书
初中数学教学随笔
2015/08/15 职场文书
Python 可迭代对象 iterable的具体使用
2021/08/07 Python