给你选择Python语言实现机器学习算法的三大理由


Posted in Python onNovember 15, 2017

基于以下三个原因,我们选择Python作为实现机器学习算法的编程语言:(1) Python的语法清晰;(2) 易于操作纯文本文件;(3) 使用广泛,存在大量的开发文档。

可执行伪代码

Python具有清晰的语法结构,大家也把它称作可执行伪代码(executable pseudo-code)。默认安装的Python开发环境已经附带了很多高级数据类型,如列表、元组、字典、集合、队列等,无需进一步编程就可以使用这些数据类型的操作。使用这些数据类型使得实现抽象的数学概念非常简单。此外,读者还可以使用自己熟悉的编程风格,如面向对象编程、面向过程编程、或者函数式编程。不熟悉Python的读者可以参阅附录A,该附录详细介绍了Python语言、Python使用的数据类型以及安装指南。

Python语言处理和操作文本文件非常简单,非常易于处理非数值型数据。Python语言提供了丰富的正则表达式函数以及很多访问Web页面的函数库,使得从HTML中提取数据变得非常简单直观。

Python比较流行

Python语言使用广泛,代码范例也很多,便于读者快速学习和掌握。此外,在开发实际应用程序时,也可以利用丰富的模块库缩短开发周期。

在科学和金融领域,Python语言得到了广泛应用。SciPy和NumPy等许多科学函数库都实现了向量和矩阵操作,这些函数库增加了代码的可读性,学过线性代数的人都可以看懂代码的实际功能。另外,科学函数库SciPy和NumPy使用底层语言(C和Fortran)编写,提高了相关应用程序的计算性能。本书将大量使用Python的NumPy。

Python的科学工具可以与绘图工具Matplotlib协同工作。Matplotlib可以绘制2D、3D图形,也可以处理科学研究中经常使用到的图形,所以本书也将大量使用Matplotlib。

Python开发环境还提供了交互式shell环境,允许用户开发程序时查看和检测程序内容。

Python开发环境将来还会集成Pylab模块,它将NumPy、SciPy和Matplotlib合并为一个开发环境。在本书写作时,Pylab还没有并入Python环境,但是不远的将来我们肯定可以在Python开发环境找到它。

Python语言的特色

诸如MATLAB和Mathematica等高级程序语言也允许用户执行矩阵操作,MATLAB甚至还有许多内嵌的特征可以轻松地构造机器学习应用,而且MATLAB的运算速度也很快。然而MATLAB的不足之处是软件费用太高,单个软件授权就要花费数千美元。虽然也有适合MATLAB的第三方插件,但是没有一个有影响力的大型开源项目。

Java和C等强类型程序设计语言也有矩阵数学库,然而对于这些程序设计语言来说,最大的问题是即使完成简单的操作也要编写大量的代码。程序员首先需要定义变量的类型,对于Java来说,每次封装属性时还需要实现getter和setter方法。另外还要记着实现子类,即使并不想使用子类,也必须实现子类方法。为了完成一个简单的工作,我们必须花费大量时间编写了很多无用冗长的代码。Python语言则与Java和C完全不同,它清晰简练,而且易于理解,即使不是编程人员也能够理解程序的含义,而Java和C对于非编程人员则像天书一样难于理解。

所有人在小学二年级已经学会了写作,然而大多数人必须从事其他更重要的工作。

——鲍比·奈特

也许某一天,我们可以在这句话中将“写作”替代为“编写代码”,虽然有些人对于编写代码很感兴趣,但是对于大多数人来说,编程仅是完成其他任务的工具而已。Python语言是高级编程语言,我们可以花费更多的时间处理数据的内在含义,而无须花费太多精力解决计算机如何得到数据结果。Python语言使得我们很容易表达自己的目的。

Python语言的缺点

Python语言唯一的不足是性能问题。Python程序运行的效率不如Java或者C代码高,但是我们可以使用Python调用C编译的代码。这样,我们就可以同时利用C和Python的优点,逐步地开发机器学习应用程序。我们可以首先使用Python编写实验程序,如果进一步想要在产品中实现机器学习,转换成C代码也不困难。如果程序是按照模块化原则组织的,我们可以先构造可运行的Python程序,然后再逐步使用C代码替换核心代码以改进程序的性能。C++ Boost库就适合完成这个任务,其他类似于Cython和PyPy的工具也可以编写强类型的Python代码,改进一般Python程序的性能。

如果程序的算法或者思想有缺陷,则无论程序的性能如何,都无法得到正确的结果。如果解决问题的思想存在问题,那么单纯通过提高程序的运行效率,扩展用户规模都无法解决这个核心问题。从这个角度来看,Python快速实现系统的优势就更加明显了,我们可以快速地检验算法或者思想是否正确,如果需要,再进一步优化代码。

注:本文摘自《机器学习实战》

给你选择Python语言实现机器学习算法的三大理由

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python统计列表中的重复项出现的次数的方法
Aug 18 Python
Python中的is和id用法分析
Jan 26 Python
Python中二维列表如何获取子区域元素的组成
Jan 19 Python
Python使用flask框架操作sqlite3的两种方式
Jan 31 Python
代码讲解Python对Windows服务进行监控
Feb 11 Python
python3中os.path模块下常用的用法总结【推荐】
Sep 16 Python
python如何实现视频转代码视频
Jun 17 Python
python GUI库图形界面开发之PyQt5窗口类QMainWindow详细使用方法
Feb 26 Python
jupyter notebook清除输出方式
Apr 10 Python
sklearn和keras的数据切分与交叉验证的实例详解
Jun 19 Python
如何用Matplotlib 画三维图的示例代码
Jul 28 Python
python 密码学示例——理解哈希(Hash)算法
Sep 21 Python
Python数据结构之顺序表的实现代码示例
Nov 15 #Python
Django中ORM表的创建和增删改查方法示例
Nov 15 #Python
11月编程语言排行榜 Python逆袭C#上升到第4
Nov 15 #Python
Python竟能画这么漂亮的花,帅呆了(代码分享)
Nov 15 #Python
Python中turtle作图示例
Nov 15 #Python
Django原生sql也能使用Paginator分页的示例代码
Nov 15 #Python
使用Python的turtle模块画图的方法
Nov 15 #Python
You might like
在PHP3中实现SESSION的功能(三)
2006/10/09 PHP
php xml-rpc远程调用
2008/12/19 PHP
php MsSql server时遇到的中文编码问题
2009/06/11 PHP
file_get_contents获取不到网页内容的解决方法
2013/03/07 PHP
探讨:如何使用PhpDocumentor生成文档
2013/06/25 PHP
64位windows系统下安装Memcache缓存
2015/12/06 PHP
javascript的函数、创建对象、封装、属性和方法、继承
2011/03/10 Javascript
JQury slideToggle闪烁问题及解决办法
2011/07/05 Javascript
javascript权威指南 学习笔记之javascript数据类型
2011/09/24 Javascript
JavaScript indexOf方法入门实例(计算指定字符在字符串中首次出现的位置)
2014/10/17 Javascript
js中style.display=""无效的解决方法
2014/10/30 Javascript
js中this用法实例详解
2015/05/05 Javascript
一个可复用的vue分页组件
2017/05/15 Javascript
详解AngularJS脏检查机制及$timeout的妙用
2017/06/19 Javascript
Node.js API详解之 assert模块用法实例分析
2020/05/26 Javascript
基于js实现判断浏览器类型代码实例
2020/07/17 Javascript
vue-列表下详情的展开与折叠案例
2020/07/28 Javascript
一文秒懂JavaScript构造函数、实例、原型对象以及原型链
2020/08/25 Javascript
[43:24]VG vs Serenity 2018国际邀请赛小组赛BO2 第二场 8.17
2018/08/20 DOTA
[00:34]拔城逐梦,热血永恒!2020(秋)完美世界城市挑战赛报名开启
2020/10/09 DOTA
Python3 入门教程 简单但比较不错
2009/11/29 Python
使用python 获取进程pid号的方法
2014/03/10 Python
简单介绍Python中的readline()方法的使用
2015/05/24 Python
Python编程中的文件读写及相关的文件对象方法讲解
2016/01/19 Python
在Python中通过threading模块定义和调用线程的方法
2016/07/12 Python
Python爬虫爬取煎蛋网图片代码实例
2019/12/16 Python
Pandas实现DataFrame按行求百分数(比例数)
2019/12/27 Python
Python如何使用OS模块调用cmd
2020/02/27 Python
keras 模型参数,模型保存,中间结果输出操作
2020/07/06 Python
雅诗兰黛美国官网:Estee Lauder美国
2016/07/21 全球购物
CheapTickets泰国:廉价航班,查看促销价格并预订机票
2019/12/28 全球购物
使用索引(Index)有哪些需要考虑的因素
2016/10/19 面试题
研发工程师岗位职责
2014/04/28 职场文书
党的群众路线对照检查材料
2014/08/27 职场文书
自己搭建resnet18网络并加载torchvision自带权重的操作
2021/05/13 Python
LyScript实现绕过反调试保护的示例详解
2022/08/14 Python