编程 Python

Keras官方中文文档:性能评估Metrices详解

Posted in Python onJune 15, 2020

能评估

使用方法

性能评估模块提供了一系列用于模型性能评估的函数,这些函数在模型编译时由metrics关键字设置

性能评估函数类似与目标函数, 只不过该性能的评估结果讲不会用于训练.

可以通过字符串来使用域定义的性能评估函数

model.compile(loss='mean_squared_error',
    optimizer='sgd',
    metrics=['mae', 'acc'])

也可以自定义一个Theano/TensorFlow函数并使用之

from keras import metrics
 
model.compile(loss='mean_squared_error',
    optimizer='sgd',
    metrics=[metrics.mae, metrics.categorical_accuracy])

参数

y_true:真实标签,theano/tensorflow张量

y_pred:预测值, 与y_true形式相同的theano/tensorflow张量

返回值

单个用以代表输出各个数据点上均值的值

可用预定义张量

除fbeta_score额外拥有默认参数beta=1外,其他各个性能指标的参数均为y_true和y_pred

binary_accuracy: 对二分类问题,计算在所有预测值上的平均正确率

categorical_accuracy:对多分类问题,计算再所有预测值上的平均正确率

sparse_categorical_accuracy:与categorical_accuracy相同,在对稀疏的目标值预测时有用

top_k_categorical_accracy: 计算top-k正确率,当预测值的前k个值中存在目标类别即认为预测正确

sparse_top_k_categorical_accuracy：与top_k_categorical_accracy作用相同，但适用于稀疏情况

定制评估函数

定制的评估函数可以在模型编译时传入,该函数应该以(y_true, y_pred)为参数,并返回单个张量,或从metric_name映射到metric_value的字典,下面是一个示例:

(y_true, y_pred) as arguments and return a single tensor value.
import keras.backend as K
def mean_pred(y_true, y_pred):
 return K.mean(y_pred)
 
model.compile(optimizer='rmsprop',
    loss='binary_crossentropy',
    metrics=['accuracy', mean_pred])

补充知识：Keras.metrics中的accuracy总结

1. 背景

Accuracy（准确率）是机器学习中最简单的一种评价模型好坏的指标，每一个从事机器学习工作的人一定都使用过这个指标。没从事过机器学习的人大都也知道这个指标，比如你去向别人推销一款自己做出来的字符识别软件，人家一定会问你准确率是多少。准确率听起来简单，但不是所有人都能理解得透彻，本文将介绍Keras中accuracy（也适用于Tensorflow）的几个新“玩法”。

2. Keras中的accuracy介绍

Keras.metrics中总共给出了6种accuracy，如下图所示：

Keras官方中文文档:性能评估Metrices详解

接下来将对这些accuracy进行逐个介绍。

1) accuracy

该accuracy就是大家熟知的最朴素的accuracy。比如我们有6个样本，其真实标签y_true为[0, 1, 3, 3, 4, 2]，但被一个模型预测为了[0, 1, 3, 4, 4, 4]，即y_pred=[0, 1, 3, 4, 4, 4]，那么该模型的accuracy=4/6=66.67%。

2) binary_accuracy

binary_accuracy和accuracy最大的不同就是，它适用于2分类的情况。从上图中可以看到binary_accuracy的计算除了y_true和y_pred外，还有一个threshold参数，该参数默认为0.5。比如有6个样本，其y_true为[0, 0, 0, 1, 1, 0]，y_pred为[0.2, 0.3, 0.6, 0.7, 0.8, 0.1]，那么其binary_accuracy=5/6=87.5%。具体计算方法为：1）将y_pred中的每个预测值和threshold对比，大于threshold的设为1，小于等于threshold的设为0，得到y_pred_new=[0, 0, 1, 1, 1, 0]；2）将y_true和y_pred_new代入到2.1中计算得到最终的binary_accuracy=87.5%。

3) categorical_accuracy

categorical_accuracy和accuracy也很像。不同的是accuracy针对的是y_true和y_pred都为具体标签的情况，而categorical_accuracy针对的是y_true为onehot标签，y_pred为向量的情况。比如有4个样本，其y_true为[[0, 0, 1], [0, 1, 0], [0, 1, 0], [1, 0, 0]]，y_pred为[[0.1, 0.6, 0.3], [0.2, 0.7, 0.1], [0.3, 0.6, 0.1], [0.9, 0, 0.1]]，则其categorical_accuracy为75%。具体计算方法为：1）将y_true转为非onehot的形式，即y_true_new=[2, 1, 1, 0]；2）根据y_pred中的每个样本预测的分数得到y_pred_new=[1, 1, 1, 0]；3）将y_true_new和y_pred_new代入到2.1中计算得到最终的categorical_accuracy=75%。

4) sparse_categorical_accuracy

和categorical_accuracy功能一样，只是其y_true为非onehot的形式。比如有4个样本，其y_true为[2， 1， 1， 0]，y_pred为[[0.1, 0.6, 0.3], [0.2, 0.7, 0.1], [0.3, 0.6, 0.1], [0.9, 0, 0.1]]，则其categorical_accuracy为75%。具体计算方法为：1）根据y_pred中的每个样本预测的分数得到y_pred_new=[1, 1, 1, 0]；2）将y_true和y_pred_new代入到2.1中计算得到最终的categorical_accuracy=75%。

5) top_k_categorical_accuracy

在categorical_accuracy的基础上加上top_k。categorical_accuracy要求样本在真值类别上的预测分数是在所有类别上预测分数的最大值，才算预测对，而top_k_categorical_accuracy只要求样本在真值类别上的预测分数排在其在所有类别上的预测分数的前k名就行。比如有4个样本，其y_true为[[0, 0, 1], [0, 1, 0], [0, 1, 0], [1, 0, 0]]，y_pred为[[0.3, 0.6, 0.1], [0.5, 0.4, 0.1], [0.3, 0.6, 0.1], [0.9, 0, 0.1]]，根据前面知识我们可以计算得到其categorical_accuracy=50%，但是其top_k_categorical_accuracy是多少呢？答案跟k息息相关。如果k大于或等于3，其top_k_categorical_accuracy毫无疑问是100%，因为总共就3个类别。如果k小于3，那就要计算了，比如k=2，那么top_k_categorical_accuracy=75%。具体计算方法为：1）将y_true转为非onehot的形式，即y_true_new=[2, 1, 1, 0]；2）计算y_pred的top_k的label，比如k=2时，y_pred_new = [[0, 1], [0, 1], [0, 1], [0, 2]]；3）根据每个样本的真实标签是否在预测标签的top_k内来统计准确率，上述4个样本为例，2不在[0, 1]内，1在[0, 1]内，1在[0, 1]内，0在[0, 2]内，4个样本总共预测对了3个，因此k=2时top_k_categorical_accuracy=75%。说明一下，Keras中计算top_k_categorical_accuracy时默认的k值为5。

6) sparse_top_k_categorical_accuracy

和top_k_categorical_accuracy功能一样，只是其y_true为非onehot的形式。比如有4个样本，其y_true为[2， 1， 1， 0]，y_pred为[[0.3, 0.6, 0.1], [0.5, 0.4, 0.1], [0.3, 0.6, 0.1], [0.9, 0, 0.1]]。计算sparse_top_k_categorical_accuracy的步骤如下：1）计算y_pred的top_k的label，比如k=2时，y_pred_new = [[0, 1], [0, 1], [0, 1], [0, 2]]；2）根据每个样本的真实标签是否在预测标签的top_k内来统计准确率，上述4个样本为例，2不在[0, 1]内，1在[0, 1]内，1在[0, 1]内，0在[0, 2]内，4个样本总共预测对了3个，因此k=2时top_k_categorical_accuracy=75%。

3. 总结

综上，keras中的accuracy metric用法很多，大家可以根据自己的实际情况选择合适的accuracy metric。以下是几个比较常见的用法：

1) 当你的标签和预测值都是具体的label index（如y_true=[1, 2, 1], y_pred=[0, 1, 1]）时，用keras.metrics.accuracy。

2) 当你的标签是具体的label index，而prediction是向量形式（如y_true=[1, 2, 1], y_pred=[[0.2, 0.3, 0.5], [0.9, 0.1, 0], [0, 0.4, 0.6]]）时，用keras.metrics.sparse_categorical_accuracy。

3）当你的标签是onehot形式，而prediction是向量形式（如y_true=[[0, 1, 0], [0, 0, 1], [0, 1, 0]], y_pred=[[0.2, 0.3, 0.5], [0.9, 0.1, 0], [0, 0.4, 0.6]]）时，用keras.metrics.categorical_accuracy。

当然，还有其他更高级的用法，比如对每个类别的accuracy求平均，或者对每个类别的accuracy进行加权，或者对每个样本的accuracy进行加权等，不在本文的讨论范围，大家有兴趣可以去参考Tensorflow或者Keras的官方文档。

以上这篇Keras官方中文文档:性能评估Metrices详解就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

Keras官方中文文档:性能评估Metrices详解

- Author -

macair123

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python使用Matplotlib实现Logos设计代码

Dec 25 Python

Python返回数组/List长度的实例

Jun 23 Python

django缓存配置的几种方法详解

Jul 16 Python

PyQt弹出式对话框的常用方法及标准按钮类型

Feb 27 Python

python关于矩阵重复赋值覆盖问题的解决方法

Jul 19 Python

python自动保存百度盘资源到百度盘中的实例代码

Aug 26 Python

Python内置函数locals和globals对比

Apr 28 Python

django创建超级用户时指定添加其它字段方式

May 14 Python

如何用python处理excel表格

Jun 09 Python

如何利用python进行时间序列分析

Aug 04 Python

浅谈python 类方法/静态方法

Sep 18 Python

Python中快速掌握Data Frame的常用操作

Mar 31 Python

在keras里面实现计算f1-score的代码

Jun 15 #Python

Python流程控制语句的深入讲解

Jun 15 #Python

keras自定义损失函数并且模型加载的写法介绍

Jun 15 #Python

python语言是免费还是收费的？

Jun 15 #Python

DataFrame.groupby()所见的各种用法详解

Jun 14 #Python

详解pandas.DataFrame.plot() 画图函数

Jun 14 #Python

Pandas把dataframe或series转换成list的方法

Jun 14 #Python

You might like

ThinkPHP的L方法使用简介

2014/06/18 PHP

PHP yii实现model添加默认值的方法(两种方法)

2016/11/10 PHP

javascript AOP 实现ajax回调函数使用比较方便

2010/11/20 Javascript

基于jquery的文章中所有图片width大小批量设置方法

2013/08/01 Javascript

javascript常用对话框小集

2013/09/13 Javascript

Javascript基础教程之比较操作符

2015/01/18 Javascript

Knockout自定义绑定创建方法

2015/12/26 Javascript

bootstrap 下拉多选框进行多选传值问题代码分析

2017/02/14 Javascript

vue实现在一个方法执行完后执行另一个方法的示例

2018/08/25 Javascript

创建echart多个联动的示例代码

2018/11/23 Javascript

通过js给网页加上水印背景实例

2019/06/17 Javascript

JQuery样式与属性设置方法分析

2019/12/07 jQuery

Map与WeakMap类型在JavaScript中的使用详解

2020/11/18 Javascript

[41:56]Spirit vs Liquid Supermajor小组赛A组 BO3 第一场 6.2

2018/06/03 DOTA

python实现的生成随机迷宫算法核心代码分享（含游戏完整代码）

2014/07/11 Python

跟老齐学Python之数据类型总结

2014/09/24 Python

python数据结构之图深度优先和广度优先实例详解

2015/07/08 Python

python通过百度地图API获取某地址的经纬度详解

2018/01/28 Python

Django高级编程之自定义Field实现多语言

2019/07/02 Python

Tensorflow中tf.ConfigProto()的用法详解

2020/02/06 Python

python GUI库图形界面开发之PyQt5控件数据拖曳Drag与Drop详细使用方法与实例

2020/02/27 Python

浅析python 动态库m.so.1.0错误问题

2020/05/09 Python

Python轻量级web框架bottle使用方法解析

2020/06/13 Python

CSS3实现渐变背景兼容问题

2020/05/06 HTML / CSS

带你认识HTML5中的WebSocket

2015/05/22 HTML / CSS

泰国第一的化妆品网站：Konvy

2018/02/25 全球购物

澳洲网红粉泥面膜：Sand & Sky

2019/08/13 全球购物

孝老爱亲模范事迹

2014/01/24 职场文书

水利公司纪检监察自我鉴定

2014/02/25 职场文书

文体活动实施方案

2014/03/27 职场文书

党的群众路线教育实践活动个人整改方案

2014/10/25 职场文书

2014年班长个人工作总结

2014/11/14 职场文书

运动会通讯稿50字

2015/07/20 职场文书

小学运动会加油稿

2015/07/22 职场文书

浅谈CSS不规则边框的生成方案

2021/05/25 HTML / CSS

Python内置包对JSON文件数据进行编码和解码

2022/04/12 Python