Python 机器学习工具包SKlearn的安装与使用


Posted in Python onMay 14, 2021

1、SKlearn 是什么

  Sklearn(全称 SciKit-Learn),是基于 Python 语言的机器学习工具包。

  Sklearn 主要用Python编写,建立在 Numpy、Scipy、Pandas 和 Matplotlib 的基础上,也用 Cython编写了一些核心算法来提高性能。

  Sklearn 包括六大功能模块:

  • 分类(Classification):识别样本属于哪个类别,常用算法有 SVM(支持向量机)、nearest neighbors(最近邻)、random forest(随机森林)
  • 回归(Regression):预测与对象相关联的连续值属性,常用算法有 SVR(支持向量机)、 ridge regression(岭回归)、Lasso
  • 聚类(Clustering):对样本进行无监督的自动分类,常用算法有 k-Means(k均值)、spectral clustering(特征聚类)、mean-shift(均值漂移)
  • 数据降维(Dimensionality reduction):减少相关变量维数,常用算法有 PCA(主成分分析)、feature selection(特征选择)、non-negative matrix factorization(非负矩阵分解)
  • 模型选择(Model Selection):比较,验证,选择参数和模型,常用模块有 grid search(网格搜索)、cross validation(交叉验证)、 metrics(度量)
  • 数据处理 (Preprocessing):特征提取和归一化,常用模块有 preprocessing(预处理),feature extraction(特征提取)
  • 这六个功能模块涉及 4类算法,分类、回归 属于监督学习,聚类属于非监督学习。

Python 机器学习工具包SKlearn的安装与使用

  官网地址:https://scikit-learn.org/

  官方文档中文版: https://www.scikitlearn.com.cn/

  内置数据集:https://scikit-learn.org/stable/datasets.html

2、SKlearn 的安装

  Sklearn 的安装要求:Python 3.5 以上版本,需要安装 NumPy、SciPy、Pandas 工具包的支持,部分内容需要使用 Matplotlib、joblib 工具包。

  pip 安装命令:  

pip3 install -U scikit-learn
pip3 install -U scikit-learn -i https://pypi.douban.com/simple

  注意 Sklearn 建议安装 Numpy+mkl,可以在网址http://www.lfd.uci.edu/~gohlke/pythonlibs/ 找到你需要的numpy+mkl版本,下载后 pip3安装:

pip install numpy-1.11.1+mkl-cp27-cp27m-win_amd64.whl

3、SKlearn 内置数据集

  Sklearn 内置了一些标准数据集可以用于练习和测试,都是经常被引用的经典问题,数据网址:https://scikit-learn.org/stable/datasets.html  
  Sklearn 标准数据集主要包括:

测试问题数据集

  • 波士顿房价:Boston house prices dataset
  • 鸢尾花问题:Iris plants dataset
  • 糖尿病数据:Diabetes dataset
  • 手写数字的识别:Optical recognition of handwritten digits dataset
  • 体能训练:Linnerrud dataset
  • 葡萄酒鉴别:Wine recognition dataset
  • 威斯康星州癌症诊断:reast cancer wisconsin (diagnostic) dataset

实际问题数据集

  • 人脸数据:The Olivetti faces dataset
  • 20个新闻文本数据:The 20 newsgroups text dataset
  • 标记的人脸数据:The Labeled Faces in the Wild face recognition dataset
  • 森林覆盖类型:Forest covertypes
  • 路透社新闻数据:RCV1 dataset
  • 网络入侵检测数据:Kddcup 99 dataset
  • 加州住房数据:California Housing dataset

4、Sklearn 数模笔记的计划

  粗略看看 Sklearn 的文档,是一个功能强大和丰富的机器学习库,远远超出了数学建模学习的范围。
  基于数模教学的目的,本系列主要对应数模学习中的分类、聚类、降维问题,并不打算全面讲解 Sklearn 的各种算法,而是以典型问题为例来介绍原理简单、使用广泛的基本方法,以便新手入门。

Python 机器学习工具包SKlearn的安装与使用

以上就是Python 机器学习工具包SKlearn的安装与使用的详细内容,更多关于Python SKlearn的安装与使用的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python 正则表达式 概述及常用字符
May 04 Python
python使用电子邮件模块smtplib的方法
Aug 28 Python
python中json格式数据输出的简单实现方法
Oct 31 Python
python清理子进程机制剖析
Nov 23 Python
idea创建springMVC框架和配置小文件的教程图解
Sep 18 Python
python 对类的成员函数开启线程的方法
Jan 22 Python
详解python中的index函数用法
Aug 06 Python
python+adb命令实现自动刷视频脚本案例
Apr 23 Python
MxNet预训练模型到Pytorch模型的转换方式
May 25 Python
Python中zip函数如何使用
Jun 04 Python
在django中实现choices字段获取对应字段值
Jul 12 Python
Python+Appium实现自动抢微信红包
May 21 Python
python process模块的使用简介
May 14 #Python
django学习之ajax post传参的2种格式实例
May 14 #Python
Python djanjo之csrf防跨站攻击实验过程
python控制台打印log输出重复的解决方法
聊一聊python常用的编程模块
May 14 #Python
如何获取numpy array前N个最大值
May 14 #Python
使用pandas模块实现数据的标准化操作
You might like
用phpmyadmin更改mysql5.0登录密码
2008/03/25 PHP
深入了解 register_globals (附register_globals=off 网站打不开的解决方法)
2012/06/27 PHP
[原创]php逐行读取txt文件写入数组的方法
2015/07/02 PHP
PHP实现json_decode不转义中文的方法
2017/05/20 PHP
Laravel框架实现定时Task Scheduling例子
2019/10/22 PHP
对YUI扩展的Gird组件 Part-1
2007/03/10 Javascript
Js日期选择器并自动加入到输入框中示例代码
2013/08/02 Javascript
js open() 与showModalDialog()方法使用介绍
2013/09/10 Javascript
文本框水印提示效果的简单实现代码
2014/02/22 Javascript
Javascript排序算法之合并排序(归并排序)的2个例子
2014/04/04 Javascript
js实现绿白相间竖向网页百叶窗动画切换效果
2015/03/02 Javascript
Ionic如何创建APP项目
2016/06/03 Javascript
jQuery实现的模拟弹出窗口功能示例
2016/11/24 Javascript
Javascript 制作图形验证码实例详解
2016/12/22 Javascript
浅谈JS中this在各个场景下的指向
2019/08/14 Javascript
Vue 一键清空表单的实现方法
2020/02/07 Javascript
在vue中实现禁止屏幕滚动,禁止屏幕滑动
2020/07/22 Javascript
vue中实现点击变成全屏的多种方法
2020/09/27 Javascript
JS中锚点链接点击平滑滚动并自由调整到顶部位置
2021/02/06 Javascript
[56:42]完美世界DOTA2联赛循环赛 Matador vs Forest 第二场 11.06
2020/11/06 DOTA
Python中文字符串截取问题
2015/06/15 Python
使用Python生成随机密码的示例分享
2016/02/18 Python
python 使用pandas计算累积求和的方法
2019/02/08 Python
python简单验证码识别的实现方法
2019/05/10 Python
selenium跳过webdriver检测并模拟登录淘宝
2019/06/12 Python
浅谈python多进程共享变量Value的使用tips
2019/07/16 Python
详解python 支持向量机(SVM)算法
2020/09/18 Python
绢花、人造花和人造花卉:BLOOM
2019/08/07 全球购物
工地例会施工汇报材料
2014/08/22 职场文书
2014年“向国旗敬礼”网上签名寄语活动方案
2014/09/27 职场文书
团代会开幕词
2015/01/28 职场文书
网络销售员岗位职责
2015/04/11 职场文书
解决Nginx 配置 proxy_pass 后 返回404问题
2021/03/31 Servers
redis数据结构之压缩列表
2022/03/21 Redis
如何使用python包中的sched事件调度器
2022/04/30 Python
HTML实现仿Windows桌面主题特效的实现
2022/06/28 HTML / CSS