机器学习的框架偏向于Python的13个原因


Posted in Python onDecember 07, 2017

13个机器学习的框架偏向于Python的原因,供大家参考,具体内容如下

机器学习的框架偏向于Python的13个原因

前言

主要有以下原因:

1. Python是解释语言,程序写起来非常方便

写程序方便对做机器学习的人很重要。
因为经常需要对模型进行各种各样的修改,这在编译语言里很可能是牵一发而动全身的事情,Python里通常可以用很少的时间实现。

举例来说,在C等编译语言里写一个矩阵乘法,需要自己分配操作数(矩阵)的内存、分配结果的内存、手动对BLAS接口调用gemm、最后如果没用smart pointer还得手动回收内存空间。Python几乎就是import numpy; numpy.dot两句话的事。

当然现在很多面向C/C++库已经支持托管的内存管理了,这也让开发过程容易了很多,但解释语言仍然有天生的优势——不需要编译时间。这对机器学习这种需要大量prototyping和迭代的研究方向是非常有益工作效率的。

2. Python的开发生态成熟,有很多有用的库可以用

除了上面说到的NumPy,还有SciPy、NLTK、os(自带)等等不一而足。Python灵活的语法还使得包括文本操作、list/dict comprehension等非常实用的功能非常容易高效实现(编写和运行效率都高),配合lambda等使用更是方便。这也是Python良性生态背后的一大原因。相比而言,Lua虽然也是解释语言,甚至有LuaJIT这种神器加持,但其本身很难做到Python这样,一是因为有Python这个前辈占领着市场份额,另一个也因为它本身种种反常识的设计(比如全局变量)。不过借着Lua-Python bridge和Torch的东风,Lua似乎也在寄生兴起。

3. Python的效率很高。

解释语言的发展已经大大超过许多人的想象。很多比如list comprehension的语法糖都是贴近内核实现的。除了JIT[1]之外,还有Cython可以大幅增加运行效率。最后,得益于Python对C的接口,很多像gnumpy, theano这样高效、Python接口友好的库可以加速程序的运行,在强大团队的支撑下,这些库的效率可能比一个不熟练的程序员用C写一个月调优的效率还要高。

4.数据存储方便

有sql,hadoop,mangodb,redis,spark等

5.数据获取方便

有Scrapy,beautifulsoup,requests,paramiko等

6.数据运算方便

有pandas,Numpy,scipy等

7.输出结果方便

有matplotlib,VisPy等

8.和其他语言交互方便

有ctypes,rpy2,Cython,SWIG,PyQt,boost.python

9.加速方便

有pypy,Cython,PyCUDA

10.图形图像方便

有PyOpenGL,PyOpenCV,mayavi2

11.信号处理方便

PyWavelets,scipy.signal

12.云系统支持方便

github,sourceforge,EC2,BAT,HPC

13.python开源

python支持的平台多,包括windows,linux,unix,macos。而matlab太贵,只能调用其api,用python省钱,省钱就是赚钱。
python 和 c++ 做个比较。

c++ 的cpu效率是远远高于 python 的.不过 python 是一门胶水语言,它可以和任何语言结合,基于这个优点,很多数据处理的python 库底层都是 c++ 实现的,意思就是说:你用python写code,但效率是c++的。只有那些for 循环,还是用python的效率高。

近年来机器学习最要是深度学习,而深度学习使用cuda gpu加速远比cpu要快,而cuda 是c++写的。
所以现在TensorLayer、theano 等深度学习库都是 python 编程、底层c++。

相关书籍推荐:

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python Tkinter基础控件用法
Sep 03 Python
python格式化字符串实例总结
Sep 28 Python
Python中处理unchecked未捕获异常实例
Jan 17 Python
python删除指定类型(或非指定)的文件实例详解
Jul 06 Python
查看python下OpenCV版本的方法
Aug 03 Python
Django添加KindEditor富文本编辑器的使用
Oct 24 Python
Python补齐字符串长度的实例
Nov 15 Python
python读取图片任意范围区域
Jan 23 Python
Python 微信爬虫完整实例【单线程与多线程】
Jul 06 Python
python实现xml转json文件的示例代码
Dec 30 Python
Pytorch可视化的几种实现方法
Jun 10 Python
OpenCV-Python 实现两张图片自动拼接成全景图
Jun 11 Python
python编程线性回归代码示例
Dec 07 #Python
基于Django的ModelForm组件(详解)
Dec 07 #Python
利用python编写一个图片主色转换的脚本
Dec 07 #Python
python八大排序算法速度实例对比
Dec 06 #Python
Python语言实现将图片转化为html页面
Dec 06 #Python
Python实现比较扑克牌大小程序代码示例
Dec 06 #Python
Python3简单实例计算同花的概率代码
Dec 06 #Python
You might like
第4章 数据处理-php正则表达式-郑阿奇(续)
2011/07/04 PHP
Yii获取当前url和域名的方法
2015/06/08 PHP
基于ThinkPHP+uploadify+upload+PHPExcel 无刷新导入数据
2015/09/23 PHP
PHP版本常用的排序算法汇总
2015/12/20 PHP
[原创]PHP正则删除html代码中a标签并保留标签内容的方法
2017/05/23 PHP
PHP实现搜索时记住状态的方法示例
2018/05/11 PHP
CLASS_CONFUSION JS混淆 全源码
2007/12/12 Javascript
自己写的兼容ie和ff的在线文本编辑器类似ewebeditor
2012/12/12 Javascript
使用jQuery同时控制四张图片的伸缩实现代码
2013/04/19 Javascript
jquery实现个人中心导航菜单效果和美观都非常不错
2014/09/02 Javascript
JavaScript实现点击按钮复制指定区域文本(推荐)
2016/11/25 Javascript
遍历json 对象的属性并且动态添加属性的实现
2016/12/02 Javascript
vue2.0基于vue-cli+element-ui制作树形treeTable
2019/04/30 Javascript
js 计算月/周的第一天和最后一天代码
2020/02/01 Javascript
解决Vue-Router升级导致的Uncaught (in promise)问题
2020/08/07 Javascript
详解vue 中 scoped 样式作用域的规则
2020/09/14 Javascript
[48:21]Mski vs VGJ.S Supermajor小组赛C组 BO3 第一场 6.3
2018/06/04 DOTA
python实现感知器算法详解
2017/12/19 Python
python看某个模块的版本方法
2018/10/16 Python
Python使用sorted对字典的key或value排序
2018/11/15 Python
Python读取Pickle文件信息并计算与当前时间间隔的方法分析
2019/01/30 Python
django连接oracle时setting 配置方法
2019/08/29 Python
python脚本监控logstash进程并邮件告警实例
2020/04/28 Python
html5 迷宫游戏(碰撞检测)实例一
2013/07/25 HTML / CSS
意大利体育用品网上商城:Nencini Sport
2016/08/18 全球购物
高性能钓鱼服装:Huk Gear
2019/02/20 全球购物
西班牙土拨鼠床垫公司,感觉在云端:Marmota
2019/03/18 全球购物
德国亚马逊官方网站:Amazon.de
2020/11/15 全球购物
微博营销计划书
2014/01/10 职场文书
《池塘边的叫声》教学反思
2014/04/12 职场文书
简洁的英文求职信范文
2014/05/03 职场文书
党的群众路线教育实践方案
2014/05/11 职场文书
校园新闻广播稿5篇
2014/10/10 职场文书
公务员群众路线心得体会
2014/11/03 职场文书
《日月潭》教学反思
2016/02/20 职场文书
详解JavaScript中Arguments对象用途
2021/08/30 Javascript