Python 机器学习工具包SKlearn的安装与使用


Posted in Python onMay 14, 2021

1、SKlearn 是什么

  Sklearn(全称 SciKit-Learn),是基于 Python 语言的机器学习工具包。

  Sklearn 主要用Python编写,建立在 Numpy、Scipy、Pandas 和 Matplotlib 的基础上,也用 Cython编写了一些核心算法来提高性能。

  Sklearn 包括六大功能模块:

  • 分类(Classification):识别样本属于哪个类别,常用算法有 SVM(支持向量机)、nearest neighbors(最近邻)、random forest(随机森林)
  • 回归(Regression):预测与对象相关联的连续值属性,常用算法有 SVR(支持向量机)、 ridge regression(岭回归)、Lasso
  • 聚类(Clustering):对样本进行无监督的自动分类,常用算法有 k-Means(k均值)、spectral clustering(特征聚类)、mean-shift(均值漂移)
  • 数据降维(Dimensionality reduction):减少相关变量维数,常用算法有 PCA(主成分分析)、feature selection(特征选择)、non-negative matrix factorization(非负矩阵分解)
  • 模型选择(Model Selection):比较,验证,选择参数和模型,常用模块有 grid search(网格搜索)、cross validation(交叉验证)、 metrics(度量)
  • 数据处理 (Preprocessing):特征提取和归一化,常用模块有 preprocessing(预处理),feature extraction(特征提取)
  • 这六个功能模块涉及 4类算法,分类、回归 属于监督学习,聚类属于非监督学习。

Python 机器学习工具包SKlearn的安装与使用

  官网地址:https://scikit-learn.org/

  官方文档中文版: https://www.scikitlearn.com.cn/

  内置数据集:https://scikit-learn.org/stable/datasets.html

2、SKlearn 的安装

  Sklearn 的安装要求:Python 3.5 以上版本,需要安装 NumPy、SciPy、Pandas 工具包的支持,部分内容需要使用 Matplotlib、joblib 工具包。

  pip 安装命令:  

pip3 install -U scikit-learn
pip3 install -U scikit-learn -i https://pypi.douban.com/simple

  注意 Sklearn 建议安装 Numpy+mkl,可以在网址http://www.lfd.uci.edu/~gohlke/pythonlibs/ 找到你需要的numpy+mkl版本,下载后 pip3安装:

pip install numpy-1.11.1+mkl-cp27-cp27m-win_amd64.whl

3、SKlearn 内置数据集

  Sklearn 内置了一些标准数据集可以用于练习和测试,都是经常被引用的经典问题,数据网址:https://scikit-learn.org/stable/datasets.html  
  Sklearn 标准数据集主要包括:

测试问题数据集

  • 波士顿房价:Boston house prices dataset
  • 鸢尾花问题:Iris plants dataset
  • 糖尿病数据:Diabetes dataset
  • 手写数字的识别:Optical recognition of handwritten digits dataset
  • 体能训练:Linnerrud dataset
  • 葡萄酒鉴别:Wine recognition dataset
  • 威斯康星州癌症诊断:reast cancer wisconsin (diagnostic) dataset

实际问题数据集

  • 人脸数据:The Olivetti faces dataset
  • 20个新闻文本数据:The 20 newsgroups text dataset
  • 标记的人脸数据:The Labeled Faces in the Wild face recognition dataset
  • 森林覆盖类型:Forest covertypes
  • 路透社新闻数据:RCV1 dataset
  • 网络入侵检测数据:Kddcup 99 dataset
  • 加州住房数据:California Housing dataset

4、Sklearn 数模笔记的计划

  粗略看看 Sklearn 的文档,是一个功能强大和丰富的机器学习库,远远超出了数学建模学习的范围。
  基于数模教学的目的,本系列主要对应数模学习中的分类、聚类、降维问题,并不打算全面讲解 Sklearn 的各种算法,而是以典型问题为例来介绍原理简单、使用广泛的基本方法,以便新手入门。

Python 机器学习工具包SKlearn的安装与使用

以上就是Python 机器学习工具包SKlearn的安装与使用的详细内容,更多关于Python SKlearn的安装与使用的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
基于python的汉字转GBK码实现代码
Feb 19 Python
python读取Android permission文件
Nov 01 Python
Python异常学习笔记
Feb 03 Python
在Python程序中实现分布式进程的教程
Apr 28 Python
python简单猜数游戏实例
Jul 09 Python
Python实现中文数字转换为阿拉伯数字的方法示例
May 26 Python
关于python2 csv写入空白行的问题
Jun 22 Python
对Python3中dict.keys()转换成list类型的方法详解
Feb 03 Python
pycharm中显示CSS提示的知识点总结
Jul 29 Python
flask的orm框架SQLAlchemy查询实现解析
Dec 12 Python
Python读取多列数据以及用matplotlib制作图表方法实例
Sep 23 Python
python批量生成身份证号到Excel的两种方法实例
Jan 14 Python
python process模块的使用简介
May 14 #Python
django学习之ajax post传参的2种格式实例
May 14 #Python
Python djanjo之csrf防跨站攻击实验过程
python控制台打印log输出重复的解决方法
聊一聊python常用的编程模块
May 14 #Python
如何获取numpy array前N个最大值
May 14 #Python
使用pandas模块实现数据的标准化操作
You might like
全国FM电台频率大全 - 21 海南省
2020/03/11 无线电
PHP实现将MySQL重复ID二维数组重组为三维数组的方法
2016/08/01 PHP
ThinkPHP实现静态缓存和动态缓存示例代码
2017/05/02 PHP
PHP中遍历数组的三种常用方法实例分析
2019/06/24 PHP
tp5框架前台无限极导航菜单类实现方法分析
2020/03/29 PHP
html下载本地
2006/06/19 Javascript
写的htc的数据表格
2007/01/20 Javascript
分享9个最好用的JavaScript开发工具和代码编辑器
2015/03/24 Javascript
vue2组件实现懒加载浅析
2017/03/29 Javascript
基于Angularjs-router动态改变Title值的问题
2018/08/30 Javascript
React实现全局组件的Toast轻提示效果
2018/09/21 Javascript
详解Node.js读写中文内容文件操作
2018/10/10 Javascript
vue + typescript + 极验登录验证的实现方法
2019/06/27 Javascript
用Angular实现一个扫雷的游戏示例
2020/05/15 Javascript
简单使用Python自动生成文章
2014/12/25 Python
在Linux系统上部署Apache+Python+Django+MySQL环境
2015/12/24 Python
Python编程对列表中字典元素进行排序的方法详解
2017/05/26 Python
python email smtplib模块发送邮件代码实例
2018/04/26 Python
Python查看微信撤回消息代码
2018/06/07 Python
Python实现通过继承覆盖方法示例
2018/07/02 Python
基于Numba提高python运行效率过程解析
2020/03/02 Python
澳大利亚自然和有机的健康美容产品一站式商店:Ziani Beauty
2017/12/28 全球购物
专营店会计助理岗位职责
2013/11/29 职场文书
给老师的道歉信
2014/01/11 职场文书
公司中层干部的自我评价分享
2014/03/01 职场文书
公司总经理岗位职责
2014/03/15 职场文书
银行党员批评与自我批评
2014/10/15 职场文书
招商银行工作证明
2015/06/17 职场文书
欢送领导祝酒词
2015/08/12 职场文书
小学课改工作总结
2015/08/13 职场文书
庆祝教师节主题班会
2015/08/17 职场文书
导游词之桂林
2019/08/20 职场文书
PHP 技巧 * SVG 保存为图片(分享图生成)
2021/04/02 PHP
安装pytorch时报sslerror错误的解决方案
2021/05/17 Python
OpenCV中resize函数插值算法的实现过程(五种)
2021/06/05 Python
Python 可迭代对象 iterable的具体使用
2021/08/07 Python