Python sklearn中的.fit与.predict的用法说明


Posted in Python onJune 28, 2020

我就废话不多说了,大家还是直接看代码吧~

clf=KMeans(n_clusters=5) #创建分类器对象
fit_clf=clf.fit(X) #用训练器数据拟合分类器模型
clf.predict(X) #也可以给新数据数据对其预测

print(clf.cluster_centers_) #输出5个类的聚类中心

y_pred = clf.fit_predict(X) #用训练器数据X拟合分类器模型并对训练器数据X进行预测

print(y_pred) #输出预测结果

补充知识:sklearn中调用某个机器学习模型model.predict(x)和model.predict_proba(x)的区别

model.predict_proba(x)不同于model.predict(),它返回的预测值为获得所有结果的概率。(有多少个分类结果,每行就有多少个概率,对每个结果都有一个概率值,如0、1两分类就有两个概率)

我们直接上代码,通过具体例子来进一步讲解:

python3 代码实现:

# -*- coding: utf-8 -*-
"""
Created on Sat Jul 27 21:25:39 2019

@author: ZQQ
"""
from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import RandomForestClassifier
from xgboost import XGBClassifier
import numpy as np
import warnings
warnings.filterwarnings("ignore")
# 这个方法只是解决了表面,没有根治

# 数据(特征,属性)
x_train = np.array([[1,2,3], 
          [1,5,4], 
          [2,2,2], 
          [4,5,6], 
          [3,5,4], 
          [1,7,2]]) 
# 数据的标签
y_train = np.array([1, 0, 1, 1, 0, 0]) 
 
# 测试数据
x_test = np.array([[2,1,2], 
          [3,2,6], 
          [2,6,4]]) 
 
# 导入模型
model = LogisticRegression() 
 
#model = RandomForestClassifier()

#model=XGBClassifier()

model.fit(x_train, y_train)

# 返回预测标签 
print(model.predict(x_test)) 
 
print('---------------------------------------')

# 返回预测属于某标签的概率 
print(model.predict_proba(x_test))

运行结果:

Python sklearn中的.fit与.predict的用法说明

分析结果:

使用model.predict() :

预测[2,1,2]为1类

预测[3,2,6]为1类

预测[2,6,4]为0类

使用model.predict_proba() :

预测[2,1,2]的标签是0的概率为0.19442289,1的概率为0.80557711

预测[3,2,6]的标签是0的概率为0.04163615,1的概率为0.95836385

预测[2,6,4]的标签是0的概率为0.83059324,1的概率为0.16940676

预测为0类的概率值和预测为1的概率值和为1

同理,如果标签继续增加,3类:0,1, 2

预测为0类的概率值:a

预测为1类的概率值:b

预测为2类的概率值:c

预测出来的概率值的和a+b+c=1

注:model.predict_proba()返回所有标签值可能性概率值,这些值是如何排序的呢?

返回模型中每个类的样本概率,其中类按类self.classes_进行排序。

通过numpy.unique(label)方法,对label中的所有标签值进行从小到大的去重排序。

得到一个从小到大唯一值的排序。这也就对应于model.predict_proba()的行返回结果。

以上这篇Python sklearn中的.fit与.predict的用法说明就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python调用cmd命令行制作刷博器
Jan 13 Python
python使用BeautifulSoup分析网页信息的方法
Apr 04 Python
Python检测一个对象是否为字符串类的方法
May 21 Python
Python连接数据库学习之DB-API详解
Feb 07 Python
pandas.DataFrame选取/排除特定行的方法
Jul 03 Python
python实现画五角星和螺旋线的示例
Jan 20 Python
详解Python的循环结构知识点
May 20 Python
Python二维数组实现求出3*3矩阵对角线元素的和示例
Nov 29 Python
Django用数据库表反向生成models类知识点详解
Mar 25 Python
tensorflow实现将ckpt转pb文件的方法
Apr 22 Python
python爬虫看看虎牙女主播中谁最“顶”步骤详解
Dec 01 Python
pyqt5打包成exe可执行文件的方法
May 14 Python
浅谈sklearn中predict与predict_proba区别
Jun 28 #Python
解决Pytorch自定义层出现多Variable共享内存错误问题
Jun 28 #Python
Pytorch学习之torch用法----比较操作(Comparison Ops)
Jun 28 #Python
PyTorch的torch.cat用法
Jun 28 #Python
使用pytorch 筛选出一定范围的值
Jun 28 #Python
解析python 中/ 和 % 和 //(地板除)
Jun 28 #Python
pytorch 常用函数 max ,eq说明
Jun 28 #Python
You might like
PHP获取搜索引擎关键字来源的函数(支持百度和谷歌等搜索引擎)
2012/10/03 PHP
PHP简单生成缩略图相册的方法
2015/07/29 PHP
PHP使用MPDF类生成PDF的方法
2015/12/08 PHP
php pthreads多线程的安装与使用
2016/01/19 PHP
thinkPHP5.0框架引入Traits功能实例分析
2017/03/18 PHP
php获取ajax的headers方法与内容实例
2017/12/27 PHP
javascript事件问题
2009/09/05 Javascript
Extjs TriggerField在弹出窗口显示不出问题的解决方法
2010/01/08 Javascript
jQuery News Ticker 基于jQuery的即时新闻行情展示插件
2011/11/05 Javascript
jQuery实用基础超详细介绍
2013/04/11 Javascript
js 判断浏览器使用的语言示例代码
2014/03/22 Javascript
js判断手机访问或者PC的几个例子(常用于手机跳转)
2015/12/15 Javascript
jQuery多个版本和其他js库冲突的解决方法
2016/08/11 Javascript
解决wx.onMenuShareTimeline出现的问题
2016/08/16 Javascript
JS中解决谷歌浏览器记住密码输入框颜色改变功能
2017/02/13 Javascript
React如何解决fetch跨域请求时session失效问题
2018/11/02 Javascript
详解vue中axios请求的封装
2019/04/08 Javascript
vue.js实现照片放大功能
2020/06/23 Javascript
vue 遮罩层阻止默认滚动事件操作
2020/07/28 Javascript
利用Python的装饰器解决Bottle框架中用户验证问题
2015/04/24 Python
Python中DJANGO简单测试实例
2015/05/11 Python
python实现excel读写数据
2021/03/02 Python
TensorFlow的权值更新方法
2018/06/14 Python
Python使用Tkinter实现滚动抽奖器效果
2020/01/06 Python
详解css3自定义滚动条样式写法
2017/12/25 HTML / CSS
YOOX美国官方网站:全球著名的多品牌时尚网络概念店
2016/09/11 全球购物
戴尔英国翻新电脑和电子产品:Dell UK Refurbished Computers
2019/07/30 全球购物
哥德堡通行证:Gothenburg Pass
2019/12/09 全球购物
董事长职责范文
2013/11/08 职场文书
军训自我鉴定怎么写
2014/02/13 职场文书
副董事长岗位职责
2014/04/02 职场文书
《老山界》教学反思
2014/04/08 职场文书
夏洛特的网观后感
2015/06/15 职场文书
会计做账心得体会
2016/01/22 职场文书
2016年小学教师政治学习心得体会
2016/01/23 职场文书
Pytorch中Softmax与LogSigmoid的对比分析
2021/06/05 Python