给你选择Python语言实现机器学习算法的三大理由


Posted in Python onNovember 15, 2017

基于以下三个原因,我们选择Python作为实现机器学习算法的编程语言:(1) Python的语法清晰;(2) 易于操作纯文本文件;(3) 使用广泛,存在大量的开发文档。

可执行伪代码

Python具有清晰的语法结构,大家也把它称作可执行伪代码(executable pseudo-code)。默认安装的Python开发环境已经附带了很多高级数据类型,如列表、元组、字典、集合、队列等,无需进一步编程就可以使用这些数据类型的操作。使用这些数据类型使得实现抽象的数学概念非常简单。此外,读者还可以使用自己熟悉的编程风格,如面向对象编程、面向过程编程、或者函数式编程。不熟悉Python的读者可以参阅附录A,该附录详细介绍了Python语言、Python使用的数据类型以及安装指南。

Python语言处理和操作文本文件非常简单,非常易于处理非数值型数据。Python语言提供了丰富的正则表达式函数以及很多访问Web页面的函数库,使得从HTML中提取数据变得非常简单直观。

Python比较流行

Python语言使用广泛,代码范例也很多,便于读者快速学习和掌握。此外,在开发实际应用程序时,也可以利用丰富的模块库缩短开发周期。

在科学和金融领域,Python语言得到了广泛应用。SciPy和NumPy等许多科学函数库都实现了向量和矩阵操作,这些函数库增加了代码的可读性,学过线性代数的人都可以看懂代码的实际功能。另外,科学函数库SciPy和NumPy使用底层语言(C和Fortran)编写,提高了相关应用程序的计算性能。本书将大量使用Python的NumPy。

Python的科学工具可以与绘图工具Matplotlib协同工作。Matplotlib可以绘制2D、3D图形,也可以处理科学研究中经常使用到的图形,所以本书也将大量使用Matplotlib。

Python开发环境还提供了交互式shell环境,允许用户开发程序时查看和检测程序内容。

Python开发环境将来还会集成Pylab模块,它将NumPy、SciPy和Matplotlib合并为一个开发环境。在本书写作时,Pylab还没有并入Python环境,但是不远的将来我们肯定可以在Python开发环境找到它。

Python语言的特色

诸如MATLAB和Mathematica等高级程序语言也允许用户执行矩阵操作,MATLAB甚至还有许多内嵌的特征可以轻松地构造机器学习应用,而且MATLAB的运算速度也很快。然而MATLAB的不足之处是软件费用太高,单个软件授权就要花费数千美元。虽然也有适合MATLAB的第三方插件,但是没有一个有影响力的大型开源项目。

Java和C等强类型程序设计语言也有矩阵数学库,然而对于这些程序设计语言来说,最大的问题是即使完成简单的操作也要编写大量的代码。程序员首先需要定义变量的类型,对于Java来说,每次封装属性时还需要实现getter和setter方法。另外还要记着实现子类,即使并不想使用子类,也必须实现子类方法。为了完成一个简单的工作,我们必须花费大量时间编写了很多无用冗长的代码。Python语言则与Java和C完全不同,它清晰简练,而且易于理解,即使不是编程人员也能够理解程序的含义,而Java和C对于非编程人员则像天书一样难于理解。

所有人在小学二年级已经学会了写作,然而大多数人必须从事其他更重要的工作。

——鲍比·奈特

也许某一天,我们可以在这句话中将“写作”替代为“编写代码”,虽然有些人对于编写代码很感兴趣,但是对于大多数人来说,编程仅是完成其他任务的工具而已。Python语言是高级编程语言,我们可以花费更多的时间处理数据的内在含义,而无须花费太多精力解决计算机如何得到数据结果。Python语言使得我们很容易表达自己的目的。

Python语言的缺点

Python语言唯一的不足是性能问题。Python程序运行的效率不如Java或者C代码高,但是我们可以使用Python调用C编译的代码。这样,我们就可以同时利用C和Python的优点,逐步地开发机器学习应用程序。我们可以首先使用Python编写实验程序,如果进一步想要在产品中实现机器学习,转换成C代码也不困难。如果程序是按照模块化原则组织的,我们可以先构造可运行的Python程序,然后再逐步使用C代码替换核心代码以改进程序的性能。C++ Boost库就适合完成这个任务,其他类似于Cython和PyPy的工具也可以编写强类型的Python代码,改进一般Python程序的性能。

如果程序的算法或者思想有缺陷,则无论程序的性能如何,都无法得到正确的结果。如果解决问题的思想存在问题,那么单纯通过提高程序的运行效率,扩展用户规模都无法解决这个核心问题。从这个角度来看,Python快速实现系统的优势就更加明显了,我们可以快速地检验算法或者思想是否正确,如果需要,再进一步优化代码。

注:本文摘自《机器学习实战》

给你选择Python语言实现机器学习算法的三大理由

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python连接DB2数据库
Aug 27 Python
python爬虫之百度API调用方法
Jun 11 Python
老生常谈python之鸭子类和多态
Jun 13 Python
浅谈python中的__init__、__new__和__call__方法
Jul 18 Python
Python基于递归和非递归算法求两个数最大公约数、最小公倍数示例
May 21 Python
解决Django migrate No changes detected 不能创建表的问题
May 27 Python
matplotlib实现区域颜色填充
Mar 18 Python
Django 响应数据response的返回源码详解
Aug 06 Python
Python如何使用内置库matplotlib绘制折线图
Feb 24 Python
Python Tornado批量上传图片并显示功能
Mar 26 Python
python更新数据库中某个字段的数据(方法详解)
Nov 18 Python
MoviePy简介及Python视频剪辑自动化
Dec 18 Python
Python数据结构之顺序表的实现代码示例
Nov 15 #Python
Django中ORM表的创建和增删改查方法示例
Nov 15 #Python
11月编程语言排行榜 Python逆袭C#上升到第4
Nov 15 #Python
Python竟能画这么漂亮的花,帅呆了(代码分享)
Nov 15 #Python
Python中turtle作图示例
Nov 15 #Python
Django原生sql也能使用Paginator分页的示例代码
Nov 15 #Python
使用Python的turtle模块画图的方法
Nov 15 #Python
You might like
PHP5 安装方法
2006/10/09 PHP
PHP日期时间函数的高级应用技巧
2009/05/16 PHP
php实现水仙花数的4个示例分享
2014/04/08 PHP
PHP 文件锁与进程锁的使用示例
2017/08/07 PHP
laravel框架数据库操作、查询构建器、Eloquent ORM操作实例分析
2019/12/20 PHP
深入聊聊Array的sort方法的使用技巧.详细点评protype.js中的sortBy方法
2007/04/12 Javascript
深入理解JavaScript定时机制
2010/10/29 Javascript
Javascript异步编程的4种方法让你写出更出色的程序
2013/01/17 Javascript
js实现表格字段排序
2014/02/19 Javascript
14个有用的Jquery技巧分享
2015/01/08 Javascript
使用jquery动态加载Js文件和Css文件
2015/10/24 Javascript
基于jQuery实现拖拽图标到回收站并删除功能
2015/11/25 Javascript
js学习总结之DOM2兼容处理this问题的解决方法
2017/07/27 Javascript
vue2.0 兄弟组件(平级)通讯的实现代码
2018/01/15 Javascript
puppeteer实现html截图的示例代码
2019/01/10 Javascript
AJAX在JQuery中的应用详解
2019/01/30 jQuery
Vuex 模块化使用详解
2019/07/31 Javascript
vue实现数字滚动效果
2020/06/29 Javascript
vue导入.md文件的步骤(markdown转HTML)
2020/12/31 Vue.js
[03:46]显微镜下的DOTA2第七期——满血与残血
2014/06/20 DOTA
Python实现包含min函数的栈
2016/04/29 Python
python直接访问私有属性的简单方法
2016/07/25 Python
python合并同类型excel表格的方法
2018/04/01 Python
selenium+python 去除启动的黑色cmd窗口方法
2018/05/22 Python
Ubuntu下升级 python3.7.1流程备忘(推荐)
2018/12/10 Python
基于numpy中的expand_dims函数用法
2019/12/18 Python
使用keras根据层名称来初始化网络
2020/05/21 Python
Python hashlib和hmac模块使用方法解析
2020/12/08 Python
ANINE BING官方网站:奢华的衣橱基本款和时尚永恒的单品
2019/11/26 全球购物
淘宝店铺营销方案
2014/02/13 职场文书
土木工程求职信
2014/05/29 职场文书
学校中层领导培训心得体会
2016/01/11 职场文书
《角的度量》教学反思
2016/02/18 职场文书
MySQL为id选择合适的数据类型
2021/06/07 MySQL
JavaScript高级程序设计之变量与作用域
2021/11/17 Javascript
tree shaking对打包体积优化及作用
2022/07/07 Java/Android