编程 Python

python实现二分类和多分类的ROC曲线教程

Posted in Python onJune 15, 2020

基本概念

precision：预测为对的当中，原本为对的比例（越大越好，1为理想状态）

recall：原本为对的当中，预测为对的比例（越大越好，1为理想状态）

F-measure：F度量是对准确率和召回率做一个权衡（越大越好，1为理想状态，此时precision为1，recall为1）

accuracy：预测对的（包括原本是对预测为对，原本是错的预测为错两种情形）占整个的比例（越大越好，1为理想状态）

fp rate：原本是错的预测为对的比例（越小越好，0为理想状态）

tp rate：原本是对的预测为对的比例（越大越好，1为理想状态）

ROC曲线通常在Y轴上具有真阳性率，在X轴上具有假阳性率。这意味着图的左上角是“理想”点 - 误报率为零，真正的正率为1。这不太现实，但它确实意味着曲线下面积（AUC）通常更好。

二分类问题：ROC曲线

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function
import time
start_time = time.time()
import matplotlib.pyplot as plt
from sklearn.metrics import roc_curve
from sklearn.metrics import auc
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.metrics import recall_score,accuracy_score
from sklearn.metrics import precision_score,f1_score
from keras.optimizers import Adam,SGD,sgd
from keras.models import load_model

print('读取数据')
X_train = np.load('x_train-rotate_2.npy')
Y_train = np.load('y_train-rotate_2.npy')
print(X_train.shape)
print(Y_train.shape)

print('获取测试数据和验证数据')
X_train, X_valid, Y_train, Y_valid = train_test_split(X_train, Y_train, test_size=0.1, random_state=666)

Y_train = np.asarray(Y_train,np.uint8)
Y_valid = np.asarray(Y_valid,np.uint8)
X_valid = np.array(X_valid, np.float32) / 255.

print('获取模型')
model = load_model('./model/InceptionV3_model.h5')
opt = Adam(lr=1e-4)
model.compile(optimizer=opt, loss='binary_crossentropy')

print("Predicting")
Y_pred = model.predict(X_valid)
Y_pred = [np.argmax(y) for y in Y_pred] # 取出y中元素最大值所对应的索引
Y_valid = [np.argmax(y) for y in Y_valid]

# micro：多分类
# weighted：不均衡数量的类来说，计算二分类metrics的平均
# macro：计算二分类metrics的均值，为每个类给出相同权重的分值。
precision = precision_score(Y_valid, Y_pred, average='weighted')
recall = recall_score(Y_valid, Y_pred, average='weighted')
f1_score = f1_score(Y_valid, Y_pred, average='weighted')
accuracy_score = accuracy_score(Y_valid, Y_pred)
print("Precision_score:",precision)
print("Recall_score:",recall)
print("F1_score:",f1_score)
print("Accuracy_score:",accuracy_score)

# 二分类　ＲＯＣ曲线
# roc_curve:真正率（True Positive Rate , TPR）或灵敏度（sensitivity）
# 横坐标：假正率（False Positive Rate , FPR）
fpr, tpr, thresholds_keras = roc_curve(Y_valid, Y_pred)
auc = auc(fpr, tpr)
print("AUC : ", auc)
plt.figure()
plt.plot([0, 1], [0, 1], 'k--')
plt.plot(fpr, tpr, label='Keras (area = {:.3f})'.format(auc))
plt.xlabel('False positive rate')
plt.ylabel('True positive rate')
plt.title('ROC curve')
plt.legend(loc='best')
plt.savefig("../images/ROC/ROC_2分类.png")
plt.show()

print("--- %s seconds ---" % (time.time() - start_time))

ROC图如下所示：

python实现二分类和多分类的ROC曲线教程

多分类问题：ROC曲线

ROC曲线通常用于二分类以研究分类器的输出。为了将ROC曲线和ROC区域扩展到多类或多标签分类，有必要对输出进行二值化。⑴可以每个标签绘制一条ROC曲线。⑵也可以通过将标签指示符矩阵的每个元素视为二元预测（微平均）来绘制ROC曲线。⑶另一种用于多类别分类的评估方法是宏观平均，它对每个标签的分类给予相同的权重。

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function
import time
start_time = time.time()
import matplotlib.pyplot as plt
from sklearn.metrics import roc_curve
from sklearn.metrics import auc
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.metrics import recall_score,accuracy_score
from sklearn.metrics import precision_score,f1_score
from keras.optimizers import Adam,SGD,sgd
from keras.models import load_model
from itertools import cycle
from scipy import interp
from sklearn.preprocessing import label_binarize

nb_classes = 5
print('读取数据')
X_train = np.load('x_train-resized_5.npy')
Y_train = np.load('y_train-resized_5.npy')
print(X_train.shape)
print(Y_train.shape)

print('获取测试数据和验证数据')
X_train, X_valid, Y_train, Y_valid = train_test_split(X_train, Y_train, test_size=0.1, random_state=666)

Y_train = np.asarray(Y_train,np.uint8)
Y_valid = np.asarray(Y_valid,np.uint8)
X_valid = np.asarray(X_valid, np.float32) / 255.

print('获取模型')
model = load_model('./model/SE-InceptionV3_model.h5')
opt = Adam(lr=1e-4)
model.compile(optimizer=opt, loss='categorical_crossentropy')

print("Predicting")
Y_pred = model.predict(X_valid)
Y_pred = [np.argmax(y) for y in Y_pred] # 取出y中元素最大值所对应的索引
Y_valid = [np.argmax(y) for y in Y_valid]

# Binarize the output
Y_valid = label_binarize(Y_valid, classes=[i for i in range(nb_classes)])
Y_pred = label_binarize(Y_pred, classes=[i for i in range(nb_classes)])

# micro：多分类
# weighted：不均衡数量的类来说，计算二分类metrics的平均
# macro：计算二分类metrics的均值，为每个类给出相同权重的分值。
precision = precision_score(Y_valid, Y_pred, average='micro')
recall = recall_score(Y_valid, Y_pred, average='micro')
f1_score = f1_score(Y_valid, Y_pred, average='micro')
accuracy_score = accuracy_score(Y_valid, Y_pred)
print("Precision_score:",precision)
print("Recall_score:",recall)
print("F1_score:",f1_score)
print("Accuracy_score:",accuracy_score)

# roc_curve:真正率（True Positive Rate , TPR）或灵敏度（sensitivity）
# 横坐标：假正率（False Positive Rate , FPR）

# Compute ROC curve and ROC area for each class
fpr = dict()
tpr = dict()
roc_auc = dict()
for i in range(nb_classes):
 fpr[i], tpr[i], _ = roc_curve(Y_valid[:, i], Y_pred[:, i])
 roc_auc[i] = auc(fpr[i], tpr[i])

# Compute micro-average ROC curve and ROC area
fpr["micro"], tpr["micro"], _ = roc_curve(Y_valid.ravel(), Y_pred.ravel())
roc_auc["micro"] = auc(fpr["micro"], tpr["micro"])

# Compute macro-average ROC curve and ROC area

# First aggregate all false positive rates
all_fpr = np.unique(np.concatenate([fpr[i] for i in range(nb_classes)]))

# Then interpolate all ROC curves at this points
mean_tpr = np.zeros_like(all_fpr)
for i in range(nb_classes):
 mean_tpr += interp(all_fpr, fpr[i], tpr[i])

# Finally average it and compute AUC
mean_tpr /= nb_classes

fpr["macro"] = all_fpr
tpr["macro"] = mean_tpr
roc_auc["macro"] = auc(fpr["macro"], tpr["macro"])

# Plot all ROC curves
lw = 2
plt.figure()
plt.plot(fpr["micro"], tpr["micro"],
  label='micro-average ROC curve (area = {0:0.2f})'
  ''.format(roc_auc["micro"]),
  color='deeppink', linestyle=':', linewidth=4)

plt.plot(fpr["macro"], tpr["macro"],
  label='macro-average ROC curve (area = {0:0.2f})'
  ''.format(roc_auc["macro"]),
  color='navy', linestyle=':', linewidth=4)

colors = cycle(['aqua', 'darkorange', 'cornflowerblue'])
for i, color in zip(range(nb_classes), colors):
 plt.plot(fpr[i], tpr[i], color=color, lw=lw,
  label='ROC curve of class {0} (area = {1:0.2f})'
  ''.format(i, roc_auc[i]))

plt.plot([0, 1], [0, 1], 'k--', lw=lw)
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.05])
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('Some extension of Receiver operating characteristic to multi-class')
plt.legend(loc="lower right")
plt.savefig("../images/ROC/ROC_5分类.png")
plt.show()

print("--- %s seconds ---" % (time.time() - start_time))

ROC图如下所示：

python实现二分类和多分类的ROC曲线教程

以上这篇python实现二分类和多分类的ROC曲线教程就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

python实现二分类和多分类的ROC曲线教程

- Author -

Hinton-wu

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python爬取国外天气预报网站的方法

Jul 10 Python

Python实现列表转换成字典数据结构的方法

Mar 11 Python

TensorFlow实现RNN循环神经网络

Feb 28 Python

python使用scrapy发送post请求的坑

Sep 04 Python

对Python中小整数对象池和大整数对象池的使用详解

Jul 09 Python

python获取Linux发行版名称

Aug 30 Python

使用python批量转换文件编码为UTF-8的实现

Apr 03 Python

PageFactory设计模式基于python实现

Apr 14 Python

django restframework serializer 增加自定义字段操作

Jul 15 Python

matplotlib 多个图像共用一个colorbar的实现示例

Sep 10 Python

python - asyncio异步编程

Apr 06 Python

Python实现视频自动打码的示例代码

Apr 08 Python

python属于解释型语言么

Jun 15 #Python

python要安装在哪个盘

Jun 15 #Python

python中wheel的用法整理

Jun 15 #Python

keras绘制acc和loss曲线图实例

Jun 15 #Python

Python定义一个函数的方法

Jun 15 #Python

python是怎么被发明的

Jun 15 #Python

Keras 利用sklearn的ROC-AUC建立评价函数详解

Jun 15 #Python

You might like

phpMyAdmin出现无法载入 mcrypt 扩展,请检查PHP配置的解决方法

2012/03/26 PHP

php+mysqli使用面向对象方式查询数据库实例

2015/01/29 PHP

Yii2.0使用阿里云OSS的SDK上传图片、下载、删除图片示例

2017/09/20 PHP

PHP实现统计所有字符在字符串中出现次数的方法

2017/10/17 PHP

Mootools 1.2 手风琴（Accordion）教程

2009/09/15 Javascript

javascript面向对象特性代码实例

2014/06/12 Javascript

JS获取当前日期时间并定时刷新示例

2021/03/04 Javascript

javascript学习笔记（七）Ajax和Http状态码

2014/10/08 Javascript

JS使用cookie实现DIV提示框只显示一次的方法

2015/11/05 Javascript

jQuery手动点击实现图片轮播特效

2020/04/20 Javascript

onmouseover事件和onmouseout事件全面理解

2016/08/15 Javascript

jQuery Form表单取值的方法

2017/01/11 Javascript

JS及JQuery对Html内容编码,Html转义

2017/02/17 Javascript

bootstrap daterangepicker双日历时间段选择控件详解

2017/06/15 Javascript

基于JavaScript实现新增内容滚动播放效果附完整代码

2017/08/24 Javascript

解决Vue 项目打包后favicon无法正常显示的问题

2018/09/01 Javascript

搭建Vue从Vue-cli到router路由护卫的实现

2019/11/14 Javascript

JavaScript 中的执行上下文和执行栈实例讲解

2021/02/25 Javascript

python处理文本文件实现生成指定格式文件的方法

2014/07/31 Python

Python排序搜索基本算法之选择排序实例分析

2017/12/09 Python

numpy基础教程之np.linalg

2019/02/12 Python

Python利用pandas处理Excel数据的应用详解

2019/06/18 Python

python求最大值,不使用内置函数的实现方法

2019/07/09 Python

Python使用itchat模块实现简单的微信控制电脑功能示例

2019/08/26 Python

在pycharm中显示python画的图方法

2019/08/31 Python

python使用PIL剪切和拼接图片

2020/03/23 Python

Python3 ID3决策树判断申请贷款是否成功的实现代码

2020/05/21 Python

Django windows使用Apache实现部署流程解析

2020/10/12 Python

button在IE6/7下的黑边去除方案

2012/12/24 HTML / CSS

贝玲妃美国官方网站：Benefit美国

2016/08/28 全球购物

粉红色的鲸鱼：Vineyard Vines

2018/02/17 全球购物

丝芙兰墨西哥官网：Sephora墨西哥

2020/05/30 全球购物

初中音乐教学反思

2014/01/12 职场文书

单位工作证明格式模板

2014/10/04 职场文书

世界环境日活动总结

2015/02/11 职场文书

法制教育主题班会

2015/08/13 职场文书