Python 机器学习工具包SKlearn的安装与使用


Posted in Python onMay 14, 2021

1、SKlearn 是什么

  Sklearn(全称 SciKit-Learn),是基于 Python 语言的机器学习工具包。

  Sklearn 主要用Python编写,建立在 Numpy、Scipy、Pandas 和 Matplotlib 的基础上,也用 Cython编写了一些核心算法来提高性能。

  Sklearn 包括六大功能模块:

  • 分类(Classification):识别样本属于哪个类别,常用算法有 SVM(支持向量机)、nearest neighbors(最近邻)、random forest(随机森林)
  • 回归(Regression):预测与对象相关联的连续值属性,常用算法有 SVR(支持向量机)、 ridge regression(岭回归)、Lasso
  • 聚类(Clustering):对样本进行无监督的自动分类,常用算法有 k-Means(k均值)、spectral clustering(特征聚类)、mean-shift(均值漂移)
  • 数据降维(Dimensionality reduction):减少相关变量维数,常用算法有 PCA(主成分分析)、feature selection(特征选择)、non-negative matrix factorization(非负矩阵分解)
  • 模型选择(Model Selection):比较,验证,选择参数和模型,常用模块有 grid search(网格搜索)、cross validation(交叉验证)、 metrics(度量)
  • 数据处理 (Preprocessing):特征提取和归一化,常用模块有 preprocessing(预处理),feature extraction(特征提取)
  • 这六个功能模块涉及 4类算法,分类、回归 属于监督学习,聚类属于非监督学习。

Python 机器学习工具包SKlearn的安装与使用

  官网地址:https://scikit-learn.org/

  官方文档中文版: https://www.scikitlearn.com.cn/

  内置数据集:https://scikit-learn.org/stable/datasets.html

2、SKlearn 的安装

  Sklearn 的安装要求:Python 3.5 以上版本,需要安装 NumPy、SciPy、Pandas 工具包的支持,部分内容需要使用 Matplotlib、joblib 工具包。

  pip 安装命令:  

pip3 install -U scikit-learn
pip3 install -U scikit-learn -i https://pypi.douban.com/simple

  注意 Sklearn 建议安装 Numpy+mkl,可以在网址http://www.lfd.uci.edu/~gohlke/pythonlibs/ 找到你需要的numpy+mkl版本,下载后 pip3安装:

pip install numpy-1.11.1+mkl-cp27-cp27m-win_amd64.whl

3、SKlearn 内置数据集

  Sklearn 内置了一些标准数据集可以用于练习和测试,都是经常被引用的经典问题,数据网址:https://scikit-learn.org/stable/datasets.html  
  Sklearn 标准数据集主要包括:

测试问题数据集

  • 波士顿房价:Boston house prices dataset
  • 鸢尾花问题:Iris plants dataset
  • 糖尿病数据:Diabetes dataset
  • 手写数字的识别:Optical recognition of handwritten digits dataset
  • 体能训练:Linnerrud dataset
  • 葡萄酒鉴别:Wine recognition dataset
  • 威斯康星州癌症诊断:reast cancer wisconsin (diagnostic) dataset

实际问题数据集

  • 人脸数据:The Olivetti faces dataset
  • 20个新闻文本数据:The 20 newsgroups text dataset
  • 标记的人脸数据:The Labeled Faces in the Wild face recognition dataset
  • 森林覆盖类型:Forest covertypes
  • 路透社新闻数据:RCV1 dataset
  • 网络入侵检测数据:Kddcup 99 dataset
  • 加州住房数据:California Housing dataset

4、Sklearn 数模笔记的计划

  粗略看看 Sklearn 的文档,是一个功能强大和丰富的机器学习库,远远超出了数学建模学习的范围。
  基于数模教学的目的,本系列主要对应数模学习中的分类、聚类、降维问题,并不打算全面讲解 Sklearn 的各种算法,而是以典型问题为例来介绍原理简单、使用广泛的基本方法,以便新手入门。

Python 机器学习工具包SKlearn的安装与使用

以上就是Python 机器学习工具包SKlearn的安装与使用的详细内容,更多关于Python SKlearn的安装与使用的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python中Django 后台自定义表单控件
Mar 28 Python
Django入门使用示例
Dec 12 Python
python使用pycharm环境调用opencv库
Feb 11 Python
分析运行中的 Python 进程详细解析
Jun 22 Python
运用PyTorch动手搭建一个共享单车预测器
Aug 06 Python
在pandas中遍历DataFrame行的实现方法
Oct 23 Python
解析python 中/ 和 % 和 //(地板除)
Jun 28 Python
一文弄懂Pytorch的DataLoader, DataSet, Sampler之间的关系
Jul 03 Python
解决python pandas读取excel中多个不同sheet表格存在的问题
Jul 14 Python
Python如何爬取b站热门视频并导入Excel
Aug 10 Python
Scrapy-Redis之RedisSpider与RedisCrawlSpider详解
Nov 18 Python
Selenium获取登录Cookies并添加Cookies自动登录的方法
Dec 04 Python
python process模块的使用简介
May 14 #Python
django学习之ajax post传参的2种格式实例
May 14 #Python
Python djanjo之csrf防跨站攻击实验过程
python控制台打印log输出重复的解决方法
聊一聊python常用的编程模块
May 14 #Python
如何获取numpy array前N个最大值
May 14 #Python
使用pandas模块实现数据的标准化操作
You might like
thinkPHP中session()方法用法详解
2016/12/08 PHP
Laravel 模型使用软删除-左连接查询-表起别名示例
2019/10/24 PHP
Prototype 学习 工具函数学习($方法)
2009/07/12 Javascript
JavaScript设计模式之原型模式(Object.create与prototype)介绍
2014/12/28 Javascript
在线所见即所得HTML编辑器的实现原理浅析
2015/04/25 Javascript
javascript文本模板用法实例
2015/07/31 Javascript
JS实现密码框根据焦点的获取与失去控制文字的消失与显示效果
2015/11/26 Javascript
BootStrap3学习笔记(一)之网格系统
2016/05/20 Javascript
js轮播图代码分享
2016/07/14 Javascript
详解JavaScript常量定义
2017/01/03 Javascript
js实现QQ面板拖拽效果(慕课网DOM事件探秘)(全)
2017/09/19 Javascript
Vue 2.0 侦听器 watch属性代码详解
2019/06/19 Javascript
解决webpack多页面内存溢出的方法示例
2019/10/08 Javascript
Jquery Fade用法详解
2020/11/06 jQuery
如何在vue中使用video.js播放m3u8格式的视频
2021/02/01 Vue.js
javascript中layim之查找好友查找群组
2021/02/06 Javascript
Python探索之静态方法和类方法的区别详解
2017/10/27 Python
Python 绘图库 Matplotlib 入门教程
2018/04/19 Python
Python requests库用法实例详解
2018/08/14 Python
详解Python二维数组与三维数组切片的方法
2019/07/18 Python
python怎么提高计算速度
2020/06/11 Python
python 操作excel表格的方法
2020/12/05 Python
python中编写函数并调用的知识点总结
2021/01/13 Python
Django后端按照日期查询的方法教程
2021/02/28 Python
HTML5 Canvas实现图片缩放、翻转、颜色渐变的代码示例
2016/02/28 HTML / CSS
美国最大的宠物用品零售商:PetSmart
2016/11/14 全球购物
英国打印机墨水和碳粉商店:Printerinks
2017/06/30 全球购物
亚马逊意大利站点:Amazon.it
2020/12/31 全球购物
党员岗位承诺口号大全
2014/03/28 职场文书
学生上课迟到检讨书
2015/01/01 职场文书
2015年司机年终工作总结
2015/05/14 职场文书
岁月神偷观后感
2015/06/11 职场文书
暂住证证明
2015/06/19 职场文书
幼儿园教师教育随笔
2015/08/14 职场文书
学会用Python实现滑雪小游戏,再也不用去北海道啦
2021/05/20 Python
选购到合适的激光打印机
2022/04/21 数码科技