Python 机器学习工具包SKlearn的安装与使用


Posted in Python onMay 14, 2021

1、SKlearn 是什么

  Sklearn(全称 SciKit-Learn),是基于 Python 语言的机器学习工具包。

  Sklearn 主要用Python编写,建立在 Numpy、Scipy、Pandas 和 Matplotlib 的基础上,也用 Cython编写了一些核心算法来提高性能。

  Sklearn 包括六大功能模块:

  • 分类(Classification):识别样本属于哪个类别,常用算法有 SVM(支持向量机)、nearest neighbors(最近邻)、random forest(随机森林)
  • 回归(Regression):预测与对象相关联的连续值属性,常用算法有 SVR(支持向量机)、 ridge regression(岭回归)、Lasso
  • 聚类(Clustering):对样本进行无监督的自动分类,常用算法有 k-Means(k均值)、spectral clustering(特征聚类)、mean-shift(均值漂移)
  • 数据降维(Dimensionality reduction):减少相关变量维数,常用算法有 PCA(主成分分析)、feature selection(特征选择)、non-negative matrix factorization(非负矩阵分解)
  • 模型选择(Model Selection):比较,验证,选择参数和模型,常用模块有 grid search(网格搜索)、cross validation(交叉验证)、 metrics(度量)
  • 数据处理 (Preprocessing):特征提取和归一化,常用模块有 preprocessing(预处理),feature extraction(特征提取)
  • 这六个功能模块涉及 4类算法,分类、回归 属于监督学习,聚类属于非监督学习。

Python 机器学习工具包SKlearn的安装与使用

  官网地址:https://scikit-learn.org/

  官方文档中文版: https://www.scikitlearn.com.cn/

  内置数据集:https://scikit-learn.org/stable/datasets.html

2、SKlearn 的安装

  Sklearn 的安装要求:Python 3.5 以上版本,需要安装 NumPy、SciPy、Pandas 工具包的支持,部分内容需要使用 Matplotlib、joblib 工具包。

  pip 安装命令:  

pip3 install -U scikit-learn
pip3 install -U scikit-learn -i https://pypi.douban.com/simple

  注意 Sklearn 建议安装 Numpy+mkl,可以在网址http://www.lfd.uci.edu/~gohlke/pythonlibs/ 找到你需要的numpy+mkl版本,下载后 pip3安装:

pip install numpy-1.11.1+mkl-cp27-cp27m-win_amd64.whl

3、SKlearn 内置数据集

  Sklearn 内置了一些标准数据集可以用于练习和测试,都是经常被引用的经典问题,数据网址:https://scikit-learn.org/stable/datasets.html  
  Sklearn 标准数据集主要包括:

测试问题数据集

  • 波士顿房价:Boston house prices dataset
  • 鸢尾花问题:Iris plants dataset
  • 糖尿病数据:Diabetes dataset
  • 手写数字的识别:Optical recognition of handwritten digits dataset
  • 体能训练:Linnerrud dataset
  • 葡萄酒鉴别:Wine recognition dataset
  • 威斯康星州癌症诊断:reast cancer wisconsin (diagnostic) dataset

实际问题数据集

  • 人脸数据:The Olivetti faces dataset
  • 20个新闻文本数据:The 20 newsgroups text dataset
  • 标记的人脸数据:The Labeled Faces in the Wild face recognition dataset
  • 森林覆盖类型:Forest covertypes
  • 路透社新闻数据:RCV1 dataset
  • 网络入侵检测数据:Kddcup 99 dataset
  • 加州住房数据:California Housing dataset

4、Sklearn 数模笔记的计划

  粗略看看 Sklearn 的文档,是一个功能强大和丰富的机器学习库,远远超出了数学建模学习的范围。
  基于数模教学的目的,本系列主要对应数模学习中的分类、聚类、降维问题,并不打算全面讲解 Sklearn 的各种算法,而是以典型问题为例来介绍原理简单、使用广泛的基本方法,以便新手入门。

Python 机器学习工具包SKlearn的安装与使用

以上就是Python 机器学习工具包SKlearn的安装与使用的详细内容,更多关于Python SKlearn的安装与使用的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python运用于数据分析的简单教程
Mar 27 Python
bat和python批量重命名文件的实现代码
May 19 Python
一个基于flask的web应用诞生 bootstrap框架美化(3)
Apr 11 Python
python的paramiko模块实现远程控制和传输示例
Oct 13 Python
Django REST为文件属性输出完整URL的方法
Dec 18 Python
在Windows中设置Python环境变量的实例讲解
Apr 28 Python
Python语言快速上手学习方法
Dec 14 Python
Django 配置多站点多域名的实现步骤
May 17 Python
python 反编译exe文件为py文件的实例代码
Jun 27 Python
python实现的发邮件功能示例
Sep 11 Python
Python稀疏矩阵及参数保存代码实现
Apr 18 Python
浅谈pycharm导入pandas包遇到的问题及解决
Jun 01 Python
python process模块的使用简介
May 14 #Python
django学习之ajax post传参的2种格式实例
May 14 #Python
Python djanjo之csrf防跨站攻击实验过程
python控制台打印log输出重复的解决方法
聊一聊python常用的编程模块
May 14 #Python
如何获取numpy array前N个最大值
May 14 #Python
使用pandas模块实现数据的标准化操作
You might like
解析php中的fopen()函数用打开文件模式说明
2013/06/20 PHP
PHP异常处理浅析
2015/05/12 PHP
js 颜色选择器(兼容firefox)
2009/03/05 Javascript
js trim函数 去空格函数与正则集锦
2009/11/20 Javascript
js动态添加删除,后台取数据(示例代码)
2013/11/25 Javascript
Jquery仿IGoogle实现可拖动窗口示例代码
2014/08/22 Javascript
超级简单的jquery操作表格方法
2014/12/15 Javascript
JavaScript中string转换成number介绍
2014/12/31 Javascript
IE及IE6浏览器中判断JS文件加载成功失败的方法
2015/02/18 Javascript
JQuery日历插件My97DatePicker日期范围限制
2016/01/20 Javascript
angular源码学习第一篇 setupModuleLoader方法
2016/10/20 Javascript
jquery html5 视频播放控制代码
2016/11/06 Javascript
JS按条件 serialize() 对应标签的使用方法
2017/07/24 Javascript
jQuery访问浏览器本地存储cookie、localStorage和sessionStorage的基本用法
2017/10/20 jQuery
jQuery动态操作表单示例【基于table表格】
2018/12/06 jQuery
茶余饭后聊聊Vue3.0响应式数据那些事儿
2019/10/30 Javascript
Node登录权限验证token验证实现的方法示例
2020/05/25 Javascript
JS typeof fn === 'function' && fn()详解
2020/08/22 Javascript
[50:02]完美世界DOTA2联赛循环赛 Magma vs IO BO2第一场 11.01
2020/11/02 DOTA
学习python (2)
2006/10/31 Python
Python+Selenium自动化实现分页(pagination)处理
2017/03/31 Python
对numpy中向量式三目运算符详解
2018/10/31 Python
Python通过类的组合模拟街道红绿灯
2020/09/16 Python
python 下载m3u8视频的示例代码
2020/11/11 Python
Html5之svg可缩放矢量图形_动力节点Java学院整理
2017/07/17 HTML / CSS
巴西备受欢迎的服装和生活方式品牌:FARM Rio
2020/02/04 全球购物
网络通讯中,端口有什么含义,端口的取值范围
2012/11/23 面试题
年终考核评语
2014/01/19 职场文书
《独坐敬亭山》教学反思
2014/04/08 职场文书
学期评语大全
2014/04/30 职场文书
数学兴趣小组活动总结
2014/07/08 职场文书
任命书标准格式
2015/03/02 职场文书
社会实践心得体会范文
2016/01/14 职场文书
拥有这5个特征人,“命”都不会太差
2019/08/16 职场文书
nginx中proxy_pass各种用法详解
2021/11/07 Servers
分享几个简单MySQL优化小妙招
2022/03/31 MySQL