Python 机器学习工具包SKlearn的安装与使用


Posted in Python onMay 14, 2021

1、SKlearn 是什么

  Sklearn(全称 SciKit-Learn),是基于 Python 语言的机器学习工具包。

  Sklearn 主要用Python编写,建立在 Numpy、Scipy、Pandas 和 Matplotlib 的基础上,也用 Cython编写了一些核心算法来提高性能。

  Sklearn 包括六大功能模块:

  • 分类(Classification):识别样本属于哪个类别,常用算法有 SVM(支持向量机)、nearest neighbors(最近邻)、random forest(随机森林)
  • 回归(Regression):预测与对象相关联的连续值属性,常用算法有 SVR(支持向量机)、 ridge regression(岭回归)、Lasso
  • 聚类(Clustering):对样本进行无监督的自动分类,常用算法有 k-Means(k均值)、spectral clustering(特征聚类)、mean-shift(均值漂移)
  • 数据降维(Dimensionality reduction):减少相关变量维数,常用算法有 PCA(主成分分析)、feature selection(特征选择)、non-negative matrix factorization(非负矩阵分解)
  • 模型选择(Model Selection):比较,验证,选择参数和模型,常用模块有 grid search(网格搜索)、cross validation(交叉验证)、 metrics(度量)
  • 数据处理 (Preprocessing):特征提取和归一化,常用模块有 preprocessing(预处理),feature extraction(特征提取)
  • 这六个功能模块涉及 4类算法,分类、回归 属于监督学习,聚类属于非监督学习。

Python 机器学习工具包SKlearn的安装与使用

  官网地址:https://scikit-learn.org/

  官方文档中文版: https://www.scikitlearn.com.cn/

  内置数据集:https://scikit-learn.org/stable/datasets.html

2、SKlearn 的安装

  Sklearn 的安装要求:Python 3.5 以上版本,需要安装 NumPy、SciPy、Pandas 工具包的支持,部分内容需要使用 Matplotlib、joblib 工具包。

  pip 安装命令:  

pip3 install -U scikit-learn
pip3 install -U scikit-learn -i https://pypi.douban.com/simple

  注意 Sklearn 建议安装 Numpy+mkl,可以在网址http://www.lfd.uci.edu/~gohlke/pythonlibs/ 找到你需要的numpy+mkl版本,下载后 pip3安装:

pip install numpy-1.11.1+mkl-cp27-cp27m-win_amd64.whl

3、SKlearn 内置数据集

  Sklearn 内置了一些标准数据集可以用于练习和测试,都是经常被引用的经典问题,数据网址:https://scikit-learn.org/stable/datasets.html  
  Sklearn 标准数据集主要包括:

测试问题数据集

  • 波士顿房价:Boston house prices dataset
  • 鸢尾花问题:Iris plants dataset
  • 糖尿病数据:Diabetes dataset
  • 手写数字的识别:Optical recognition of handwritten digits dataset
  • 体能训练:Linnerrud dataset
  • 葡萄酒鉴别:Wine recognition dataset
  • 威斯康星州癌症诊断:reast cancer wisconsin (diagnostic) dataset

实际问题数据集

  • 人脸数据:The Olivetti faces dataset
  • 20个新闻文本数据:The 20 newsgroups text dataset
  • 标记的人脸数据:The Labeled Faces in the Wild face recognition dataset
  • 森林覆盖类型:Forest covertypes
  • 路透社新闻数据:RCV1 dataset
  • 网络入侵检测数据:Kddcup 99 dataset
  • 加州住房数据:California Housing dataset

4、Sklearn 数模笔记的计划

  粗略看看 Sklearn 的文档,是一个功能强大和丰富的机器学习库,远远超出了数学建模学习的范围。
  基于数模教学的目的,本系列主要对应数模学习中的分类、聚类、降维问题,并不打算全面讲解 Sklearn 的各种算法,而是以典型问题为例来介绍原理简单、使用广泛的基本方法,以便新手入门。

Python 机器学习工具包SKlearn的安装与使用

以上就是Python 机器学习工具包SKlearn的安装与使用的详细内容,更多关于Python SKlearn的安装与使用的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
详解python 发送邮件实例代码
Dec 22 Python
一百多行python代码实现抢票助手
Sep 25 Python
Python3中bytes类型转换为str类型
Sep 27 Python
selenium + python 获取table数据的示例讲解
Oct 13 Python
Python列表list排列组合操作示例
Dec 18 Python
Python计算一个点到所有点的欧式距离实现方法
Jul 04 Python
django认证系统 Authentication使用详解
Jul 22 Python
python实现比对美团接口返回数据和本地mongo数据是否一致示例
Aug 09 Python
Keras 快速解决OOM超内存的问题
Jun 11 Python
解析python 中/ 和 % 和 //(地板除)
Jun 28 Python
python中Django文件上传方法详解
Aug 05 Python
Python 读写 Matlab Mat 格式数据的操作
May 19 Python
python process模块的使用简介
May 14 #Python
django学习之ajax post传参的2种格式实例
May 14 #Python
Python djanjo之csrf防跨站攻击实验过程
python控制台打印log输出重复的解决方法
聊一聊python常用的编程模块
May 14 #Python
如何获取numpy array前N个最大值
May 14 #Python
使用pandas模块实现数据的标准化操作
You might like
ThinkPHP CURD方法之field方法详解
2014/06/18 PHP
PHP采用get获取url汉字出现乱码的解决方法
2014/11/13 PHP
Yii中的relations数据关联查询及统计功能用法详解
2016/07/14 PHP
HTML中不支持静态Expando的元素的问题
2007/03/08 Javascript
js 表单验证方法(实用)
2009/04/28 Javascript
JS定时器实例详细分析
2013/10/11 Javascript
HTTP 304错误的详细讲解
2013/11/13 Javascript
jquery获取URL中参数解决中文乱码问题的两种方法
2013/12/18 Javascript
浅谈JavaScript字符集
2014/05/22 Javascript
Node.js的包详细介绍
2015/01/14 Javascript
js实现同一页面多个运动效果的方法
2015/04/10 Javascript
BootStrap 轮播插件(carousel)支持左右手势滑动的方法(三种)
2016/07/07 Javascript
适用于手机端的jQuery图片滑块动画
2016/12/09 Javascript
手写简单的jQuery雪花飘落效果实例
2018/04/22 jQuery
简述JS浏览器的三种弹窗
2018/07/15 Javascript
Angularjs Ng_repeat中实现复选框选中并显示不同的样式方法
2018/09/12 Javascript
JavaScript ES2019中的8个新特性详解
2019/02/20 Javascript
vue 移动端注入骨架屏的配置方法
2019/06/25 Javascript
js实现贪吃蛇小游戏
2019/10/29 Javascript
JS+CSS实现过渡特效
2021/01/02 Javascript
[03:47]2015国际邀请赛第三日现场精彩回顾
2015/08/08 DOTA
[02:08]2018年度CS GO枪械皮肤设计大赛优秀作者-完美盛典
2018/12/16 DOTA
Python基于回溯法子集树模板解决数字组合问题实例
2017/09/02 Python
python爬取微信公众号文章的方法
2019/02/26 Python
在django中使用post方法时,需要增加csrftoken的例子
2020/03/13 Python
解决pycharm debug时界面下方不出现step等按钮及变量值的问题
2020/06/09 Python
Python利用imshow制作自定义渐变填充柱状图(colorbar)
2020/12/10 Python
pycharm 复制代码出现空格的解决方式
2021/01/15 Python
详解css3 mask遮罩实现一些特效
2018/10/24 HTML / CSS
Melijoe美国官网:法国奢侈童装购物网站
2017/04/19 全球购物
社区交通安全实施方案
2014/03/22 职场文书
社区助残日活动总结
2014/08/29 职场文书
2015年敬老院工作总结
2015/05/18 职场文书
毛主席纪念堂观后感
2015/06/17 职场文书
新闻稿件写作范文
2015/07/18 职场文书
golang 如何用反射reflect操作结构体
2021/04/28 Golang