Python 机器学习工具包SKlearn的安装与使用


Posted in Python onMay 14, 2021

1、SKlearn 是什么

  Sklearn(全称 SciKit-Learn),是基于 Python 语言的机器学习工具包。

  Sklearn 主要用Python编写,建立在 Numpy、Scipy、Pandas 和 Matplotlib 的基础上,也用 Cython编写了一些核心算法来提高性能。

  Sklearn 包括六大功能模块:

  • 分类(Classification):识别样本属于哪个类别,常用算法有 SVM(支持向量机)、nearest neighbors(最近邻)、random forest(随机森林)
  • 回归(Regression):预测与对象相关联的连续值属性,常用算法有 SVR(支持向量机)、 ridge regression(岭回归)、Lasso
  • 聚类(Clustering):对样本进行无监督的自动分类,常用算法有 k-Means(k均值)、spectral clustering(特征聚类)、mean-shift(均值漂移)
  • 数据降维(Dimensionality reduction):减少相关变量维数,常用算法有 PCA(主成分分析)、feature selection(特征选择)、non-negative matrix factorization(非负矩阵分解)
  • 模型选择(Model Selection):比较,验证,选择参数和模型,常用模块有 grid search(网格搜索)、cross validation(交叉验证)、 metrics(度量)
  • 数据处理 (Preprocessing):特征提取和归一化,常用模块有 preprocessing(预处理),feature extraction(特征提取)
  • 这六个功能模块涉及 4类算法,分类、回归 属于监督学习,聚类属于非监督学习。

Python 机器学习工具包SKlearn的安装与使用

  官网地址:https://scikit-learn.org/

  官方文档中文版: https://www.scikitlearn.com.cn/

  内置数据集:https://scikit-learn.org/stable/datasets.html

2、SKlearn 的安装

  Sklearn 的安装要求:Python 3.5 以上版本,需要安装 NumPy、SciPy、Pandas 工具包的支持,部分内容需要使用 Matplotlib、joblib 工具包。

  pip 安装命令:  

pip3 install -U scikit-learn
pip3 install -U scikit-learn -i https://pypi.douban.com/simple

  注意 Sklearn 建议安装 Numpy+mkl,可以在网址http://www.lfd.uci.edu/~gohlke/pythonlibs/ 找到你需要的numpy+mkl版本,下载后 pip3安装:

pip install numpy-1.11.1+mkl-cp27-cp27m-win_amd64.whl

3、SKlearn 内置数据集

  Sklearn 内置了一些标准数据集可以用于练习和测试,都是经常被引用的经典问题,数据网址:https://scikit-learn.org/stable/datasets.html  
  Sklearn 标准数据集主要包括:

测试问题数据集

  • 波士顿房价:Boston house prices dataset
  • 鸢尾花问题:Iris plants dataset
  • 糖尿病数据:Diabetes dataset
  • 手写数字的识别:Optical recognition of handwritten digits dataset
  • 体能训练:Linnerrud dataset
  • 葡萄酒鉴别:Wine recognition dataset
  • 威斯康星州癌症诊断:reast cancer wisconsin (diagnostic) dataset

实际问题数据集

  • 人脸数据:The Olivetti faces dataset
  • 20个新闻文本数据:The 20 newsgroups text dataset
  • 标记的人脸数据:The Labeled Faces in the Wild face recognition dataset
  • 森林覆盖类型:Forest covertypes
  • 路透社新闻数据:RCV1 dataset
  • 网络入侵检测数据:Kddcup 99 dataset
  • 加州住房数据:California Housing dataset

4、Sklearn 数模笔记的计划

  粗略看看 Sklearn 的文档,是一个功能强大和丰富的机器学习库,远远超出了数学建模学习的范围。
  基于数模教学的目的,本系列主要对应数模学习中的分类、聚类、降维问题,并不打算全面讲解 Sklearn 的各种算法,而是以典型问题为例来介绍原理简单、使用广泛的基本方法,以便新手入门。

Python 机器学习工具包SKlearn的安装与使用

以上就是Python 机器学习工具包SKlearn的安装与使用的详细内容,更多关于Python SKlearn的安装与使用的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python continue语句用法实例
Mar 11 Python
Python实现的简单dns查询功能示例
May 24 Python
使用python爬虫实现网络股票信息爬取的demo
Jan 05 Python
对python捕获ctrl+c手工中断程序的两种方法详解
Dec 26 Python
python矩阵/字典实现最短路径算法
Jan 17 Python
Python使用import导入本地脚本及导入模块的技巧总结
Aug 07 Python
python+mysql实现个人论文管理系统
Oct 25 Python
利用Python校准本地时间的方法教程
Oct 31 Python
Django Xadmin多对多字段过滤实例
Apr 07 Python
解决jupyter notebook 前面书写后面内容消失的问题
Apr 13 Python
python搜索算法原理及实例讲解
Nov 18 Python
Django框架实现在线考试系统的示例代码
Nov 30 Python
python process模块的使用简介
May 14 #Python
django学习之ajax post传参的2种格式实例
May 14 #Python
Python djanjo之csrf防跨站攻击实验过程
python控制台打印log输出重复的解决方法
聊一聊python常用的编程模块
May 14 #Python
如何获取numpy array前N个最大值
May 14 #Python
使用pandas模块实现数据的标准化操作
You might like
php读取mysql中文数据出现乱码的解决方法
2013/08/16 PHP
PHP实现防盗链的方法分析
2017/07/25 PHP
Jquery和JS用外部变量获取Ajax返回的参数值的方法实例(超简单)
2013/06/17 Javascript
json字符串之间的相互转换示例代码
2014/08/21 Javascript
原生js实现的贪吃蛇网页版游戏完整实例
2015/05/18 Javascript
js实现完美兼容各大浏览器的人民币大小写相互转换
2015/10/29 Javascript
js原生跨域_用script标签的简单实现
2016/09/24 Javascript
正则中的回溯定义与用法分析【JS与java实现】
2016/12/27 Javascript
javascript 实现文本使用省略号替代(超出固定高度的情况)
2017/02/21 Javascript
微信小程序 跳转传参数与传对象详解及实例代码
2017/03/14 Javascript
bootstrap模态框示例代码分享
2017/05/17 Javascript
JavaScript循环_动力节点Java学院整理
2017/06/28 Javascript
基于React Native 0.52实现轮播图效果
2020/08/25 Javascript
基于Vue插入视频的2种方法小结
2019/04/02 Javascript
JQuery animate动画应用示例
2019/05/14 jQuery
详解JavaScript 异步编程
2020/07/13 Javascript
python实现redis三种cas事务操作
2017/12/19 Python
python使用Pycharm创建一个Django项目
2018/03/05 Python
python文本数据相似度的度量
2018/03/12 Python
Python实现基于KNN算法的笔迹识别功能详解
2018/07/09 Python
python实现括号匹配的思路详解
2018/08/23 Python
对python函数签名的方法详解
2019/01/22 Python
基于django micro搭建网站实现加水印功能
2020/05/22 Python
Python+Xlwings 删除Excel的行和列
2020/12/19 Python
西班牙网上书店:Casa del Libro
2016/11/01 全球购物
Spongelle官网:美国的创意护肤洗护品牌
2019/05/15 全球购物
Myprotein西班牙官网:欧洲第一大运动营养品牌
2020/02/24 全球购物
电子技术专业中专生的自我评价
2013/12/17 职场文书
诚信考试承诺书
2014/03/27 职场文书
2014年预备党员学习新党章思想汇报
2014/09/15 职场文书
小学重阳节活动总结
2015/03/24 职场文书
2015年客房服务员工作总结
2015/05/15 职场文书
大学生活感想
2015/08/10 职场文书
运动会班级口号霸气押韵
2015/12/24 职场文书
2016年中学植树节活动总结
2016/03/16 职场文书
MySQL中CURRENT_TIMESTAMP的使用方式
2021/11/27 MySQL