Python 机器学习工具包SKlearn的安装与使用


Posted in Python onMay 14, 2021

1、SKlearn 是什么

  Sklearn(全称 SciKit-Learn),是基于 Python 语言的机器学习工具包。

  Sklearn 主要用Python编写,建立在 Numpy、Scipy、Pandas 和 Matplotlib 的基础上,也用 Cython编写了一些核心算法来提高性能。

  Sklearn 包括六大功能模块:

  • 分类(Classification):识别样本属于哪个类别,常用算法有 SVM(支持向量机)、nearest neighbors(最近邻)、random forest(随机森林)
  • 回归(Regression):预测与对象相关联的连续值属性,常用算法有 SVR(支持向量机)、 ridge regression(岭回归)、Lasso
  • 聚类(Clustering):对样本进行无监督的自动分类,常用算法有 k-Means(k均值)、spectral clustering(特征聚类)、mean-shift(均值漂移)
  • 数据降维(Dimensionality reduction):减少相关变量维数,常用算法有 PCA(主成分分析)、feature selection(特征选择)、non-negative matrix factorization(非负矩阵分解)
  • 模型选择(Model Selection):比较,验证,选择参数和模型,常用模块有 grid search(网格搜索)、cross validation(交叉验证)、 metrics(度量)
  • 数据处理 (Preprocessing):特征提取和归一化,常用模块有 preprocessing(预处理),feature extraction(特征提取)
  • 这六个功能模块涉及 4类算法,分类、回归 属于监督学习,聚类属于非监督学习。

Python 机器学习工具包SKlearn的安装与使用

  官网地址:https://scikit-learn.org/

  官方文档中文版: https://www.scikitlearn.com.cn/

  内置数据集:https://scikit-learn.org/stable/datasets.html

2、SKlearn 的安装

  Sklearn 的安装要求:Python 3.5 以上版本,需要安装 NumPy、SciPy、Pandas 工具包的支持,部分内容需要使用 Matplotlib、joblib 工具包。

  pip 安装命令:  

pip3 install -U scikit-learn
pip3 install -U scikit-learn -i https://pypi.douban.com/simple

  注意 Sklearn 建议安装 Numpy+mkl,可以在网址http://www.lfd.uci.edu/~gohlke/pythonlibs/ 找到你需要的numpy+mkl版本,下载后 pip3安装:

pip install numpy-1.11.1+mkl-cp27-cp27m-win_amd64.whl

3、SKlearn 内置数据集

  Sklearn 内置了一些标准数据集可以用于练习和测试,都是经常被引用的经典问题,数据网址:https://scikit-learn.org/stable/datasets.html  
  Sklearn 标准数据集主要包括:

测试问题数据集

  • 波士顿房价:Boston house prices dataset
  • 鸢尾花问题:Iris plants dataset
  • 糖尿病数据:Diabetes dataset
  • 手写数字的识别:Optical recognition of handwritten digits dataset
  • 体能训练:Linnerrud dataset
  • 葡萄酒鉴别:Wine recognition dataset
  • 威斯康星州癌症诊断:reast cancer wisconsin (diagnostic) dataset

实际问题数据集

  • 人脸数据:The Olivetti faces dataset
  • 20个新闻文本数据:The 20 newsgroups text dataset
  • 标记的人脸数据:The Labeled Faces in the Wild face recognition dataset
  • 森林覆盖类型:Forest covertypes
  • 路透社新闻数据:RCV1 dataset
  • 网络入侵检测数据:Kddcup 99 dataset
  • 加州住房数据:California Housing dataset

4、Sklearn 数模笔记的计划

  粗略看看 Sklearn 的文档,是一个功能强大和丰富的机器学习库,远远超出了数学建模学习的范围。
  基于数模教学的目的,本系列主要对应数模学习中的分类、聚类、降维问题,并不打算全面讲解 Sklearn 的各种算法,而是以典型问题为例来介绍原理简单、使用广泛的基本方法,以便新手入门。

Python 机器学习工具包SKlearn的安装与使用

以上就是Python 机器学习工具包SKlearn的安装与使用的详细内容,更多关于Python SKlearn的安装与使用的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
深入理解python try异常处理机制
Jun 01 Python
python 寻找优化使成本函数最小的最优解的方法
Dec 28 Python
python距离测量的方法
Mar 06 Python
新手常见6种的python报错及解决方法
Mar 09 Python
pytorch + visdom CNN处理自建图片数据集的方法
Jun 04 Python
python实现的生成word文档功能示例
Aug 23 Python
python采集百度搜索结果带有特定URL的链接代码实例
Aug 30 Python
Python中的引用和拷贝实例解析
Nov 14 Python
Python算法中的时间复杂度问题
Nov 19 Python
Python random库使用方法及异常处理方案
Mar 02 Python
Python多线程的退出控制实现
Aug 10 Python
Python request post上传文件常见要点
Nov 20 Python
python process模块的使用简介
May 14 #Python
django学习之ajax post传参的2种格式实例
May 14 #Python
Python djanjo之csrf防跨站攻击实验过程
python控制台打印log输出重复的解决方法
聊一聊python常用的编程模块
May 14 #Python
如何获取numpy array前N个最大值
May 14 #Python
使用pandas模块实现数据的标准化操作
You might like
phpmyadmin的#1251问题
2006/11/25 PHP
PHP批量检测并去除文件BOM头代码实例
2014/05/08 PHP
thinkphp autoload 命名空间自定义 namespace
2015/07/17 PHP
新手常遇到的一些jquery问题整理
2010/08/16 Javascript
Js(JavaScript)中,弹出是或否的选择框示例(confirm用法的实例分析)
2013/07/09 Javascript
Node.js开发指南中的简单实例(mysql版)
2013/09/17 Javascript
一个JS函数搞定网页标题(title)闪动效果
2014/05/13 Javascript
Jquery attr()方法 属性赋值和属性获取详解
2016/04/15 Javascript
BootStrap创建响应式导航条实例代码
2016/05/31 Javascript
Javascript删除指定元素节点的方法
2016/06/21 Javascript
JS实现刷新父页面不弹出提示框的方法
2016/06/22 Javascript
node.js中 stream使用教程
2016/08/28 Javascript
jQuery扩展实现text提示还能输入多少字节的方法
2016/11/28 Javascript
Angularjs实现下拉框联动的示例代码
2017/08/22 Javascript
基于VUE移动音乐WEBAPP跨域请求失败的解决方法
2018/01/16 Javascript
React 组件转 Vue 组件的命令写法
2018/02/28 Javascript
解决layui上传文件提示上传异常,实际文件已经上传成功的问题
2018/08/19 Javascript
vue解决一个方法同时发送多个请求的问题
2018/09/25 Javascript
js+css3实现炫酷时钟
2020/08/18 Javascript
[48:31]完美世界DOTA2联赛PWL S3 DLG vs Phoenix 第二场 12.17
2020/12/19 DOTA
centos系统升级python 2.7.3
2014/07/03 Python
python多线程同步实例教程
2019/08/11 Python
使用Python实现正态分布、正态分布采样
2019/11/20 Python
tensorflow ckpt模型和pb模型获取节点名称,及ckpt转pb模型实例
2020/01/21 Python
美国领先的商务贺卡出版商:The Gallery Collection
2018/02/13 全球购物
美国翻新电子产品商店:The Store
2019/10/08 全球购物
什么是静态路由,其特点是什么?什么是动态路由,其特点是什么?
2013/07/26 面试题
银行介绍信范文
2014/01/10 职场文书
幼儿园教师备课制度
2014/01/12 职场文书
暑期政治学习心得体会
2014/09/02 职场文书
常务副县长“三严三实”对照检查材料思想汇报
2014/10/05 职场文书
搞笑婚前保证书
2015/02/28 职场文书
离婚承诺书格式范文
2015/05/04 职场文书
儿童诗两首教学反思
2016/02/23 职场文书
Golang全局变量加锁的问题解决
2021/05/08 Golang
Mysql中的触发器定义及语法介绍
2022/06/25 MySQL