Python 机器学习工具包SKlearn的安装与使用


Posted in Python onMay 14, 2021

1、SKlearn 是什么

  Sklearn(全称 SciKit-Learn),是基于 Python 语言的机器学习工具包。

  Sklearn 主要用Python编写,建立在 Numpy、Scipy、Pandas 和 Matplotlib 的基础上,也用 Cython编写了一些核心算法来提高性能。

  Sklearn 包括六大功能模块:

  • 分类(Classification):识别样本属于哪个类别,常用算法有 SVM(支持向量机)、nearest neighbors(最近邻)、random forest(随机森林)
  • 回归(Regression):预测与对象相关联的连续值属性,常用算法有 SVR(支持向量机)、 ridge regression(岭回归)、Lasso
  • 聚类(Clustering):对样本进行无监督的自动分类,常用算法有 k-Means(k均值)、spectral clustering(特征聚类)、mean-shift(均值漂移)
  • 数据降维(Dimensionality reduction):减少相关变量维数,常用算法有 PCA(主成分分析)、feature selection(特征选择)、non-negative matrix factorization(非负矩阵分解)
  • 模型选择(Model Selection):比较,验证,选择参数和模型,常用模块有 grid search(网格搜索)、cross validation(交叉验证)、 metrics(度量)
  • 数据处理 (Preprocessing):特征提取和归一化,常用模块有 preprocessing(预处理),feature extraction(特征提取)
  • 这六个功能模块涉及 4类算法,分类、回归 属于监督学习,聚类属于非监督学习。

Python 机器学习工具包SKlearn的安装与使用

  官网地址:https://scikit-learn.org/

  官方文档中文版: https://www.scikitlearn.com.cn/

  内置数据集:https://scikit-learn.org/stable/datasets.html

2、SKlearn 的安装

  Sklearn 的安装要求:Python 3.5 以上版本,需要安装 NumPy、SciPy、Pandas 工具包的支持,部分内容需要使用 Matplotlib、joblib 工具包。

  pip 安装命令:  

pip3 install -U scikit-learn
pip3 install -U scikit-learn -i https://pypi.douban.com/simple

  注意 Sklearn 建议安装 Numpy+mkl,可以在网址http://www.lfd.uci.edu/~gohlke/pythonlibs/ 找到你需要的numpy+mkl版本,下载后 pip3安装:

pip install numpy-1.11.1+mkl-cp27-cp27m-win_amd64.whl

3、SKlearn 内置数据集

  Sklearn 内置了一些标准数据集可以用于练习和测试,都是经常被引用的经典问题,数据网址:https://scikit-learn.org/stable/datasets.html  
  Sklearn 标准数据集主要包括:

测试问题数据集

  • 波士顿房价:Boston house prices dataset
  • 鸢尾花问题:Iris plants dataset
  • 糖尿病数据:Diabetes dataset
  • 手写数字的识别:Optical recognition of handwritten digits dataset
  • 体能训练:Linnerrud dataset
  • 葡萄酒鉴别:Wine recognition dataset
  • 威斯康星州癌症诊断:reast cancer wisconsin (diagnostic) dataset

实际问题数据集

  • 人脸数据:The Olivetti faces dataset
  • 20个新闻文本数据:The 20 newsgroups text dataset
  • 标记的人脸数据:The Labeled Faces in the Wild face recognition dataset
  • 森林覆盖类型:Forest covertypes
  • 路透社新闻数据:RCV1 dataset
  • 网络入侵检测数据:Kddcup 99 dataset
  • 加州住房数据:California Housing dataset

4、Sklearn 数模笔记的计划

  粗略看看 Sklearn 的文档,是一个功能强大和丰富的机器学习库,远远超出了数学建模学习的范围。
  基于数模教学的目的,本系列主要对应数模学习中的分类、聚类、降维问题,并不打算全面讲解 Sklearn 的各种算法,而是以典型问题为例来介绍原理简单、使用广泛的基本方法,以便新手入门。

Python 机器学习工具包SKlearn的安装与使用

以上就是Python 机器学习工具包SKlearn的安装与使用的详细内容,更多关于Python SKlearn的安装与使用的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python中的ctime()方法使用教程
May 22 Python
PyQt5每天必学之带有标签的复选框
Apr 19 Python
解决PyCharm import torch包失败的问题
Oct 13 Python
python读取各种文件数据方法解析
Dec 29 Python
python利用Tesseract识别验证码的方法示例
Jan 21 Python
python实现祝福弹窗效果
Apr 07 Python
Pytorch实现神经网络的分类方式
Jan 08 Python
python-sys.stdout作为默认函数参数的实现
Feb 21 Python
如何在Win10系统使用Python3连接Hive
Oct 15 Python
python 写一个水果忍者游戏
Jan 13 Python
python 算法题——快乐数的多种解法
May 27 Python
python3中apply函数和lambda函数的使用详解
Feb 28 Python
python process模块的使用简介
May 14 #Python
django学习之ajax post传参的2种格式实例
May 14 #Python
Python djanjo之csrf防跨站攻击实验过程
python控制台打印log输出重复的解决方法
聊一聊python常用的编程模块
May 14 #Python
如何获取numpy array前N个最大值
May 14 #Python
使用pandas模块实现数据的标准化操作
You might like
第一个无线电台是由谁发明的
2021/03/01 无线电
mysql5的sql文件导入到mysql4的方法
2008/10/19 PHP
Memcache 在PHP中的使用技巧
2010/02/08 PHP
php数组函数序列之array_sum() - 计算数组元素值之和
2011/10/29 PHP
学习PHP session的传递方式
2016/06/15 PHP
Laravel框架下载,安装及路由操作图文详解
2019/12/04 PHP
javascript中的变量是传值还是传址的?
2010/04/19 Javascript
javascript五图轮播切换实用版
2012/08/17 Javascript
jquery ui dialog实现弹窗特效的思路及代码
2013/08/03 Javascript
jquery 实现input输入什么div图层显示什么
2014/06/15 Javascript
基于zepto.js简单实现上传图片
2016/06/21 Javascript
微信小程序搜索组件wxSearch实例详解
2017/06/08 Javascript
JS基于开关思想实现的数组去重功能【案例】
2019/02/18 Javascript
JavaScript获取某一天所在的星期
2019/09/05 Javascript
微信小程序停止其他视频播放当前视频的实例代码
2019/12/25 Javascript
javascript实现蒙版与禁止页面滚动
2020/01/11 Javascript
JS实现进度条动态加载特效
2020/03/25 Javascript
python sort、sorted高级排序技巧
2014/11/21 Python
探索Python3.4中新引入的asyncio模块
2015/04/08 Python
Python RuntimeError: thread.__init__() not called解决方法
2015/04/28 Python
python3.5 tkinter实现页面跳转
2018/01/30 Python
python numpy格式化打印的实例
2018/05/14 Python
python读写csv文件实例代码
2019/07/05 Python
python递归函数求n的阶乘,优缺点及递归次数设置方式
2020/04/02 Python
Python pathlib模块使用方法及实例解析
2020/10/05 Python
css3 按钮样式简单可扩展创建
2013/03/18 HTML / CSS
物业管理毕业生个人的求职信
2013/11/30 职场文书
高级护理专业毕业生推荐信
2013/12/25 职场文书
八年级数学教学反思
2014/01/31 职场文书
《童趣》教学反思
2014/02/19 职场文书
投标授权委托书范文
2014/08/02 职场文书
个人授权委托书样本
2014/09/13 职场文书
纪念九一八事变演讲稿:忘记意味着背叛
2014/09/14 职场文书
合作经营协议书范本
2014/09/16 职场文书
选对餐饮营销策略,营业额才会上涨
2019/08/27 职场文书
在Oracle表中进行关键词搜索的过程
2022/06/10 Oracle