python人工智能human learn绘图可创建机器学习模型


Posted in Python onNovember 23, 2021

如今,数据科学家经常给带有标签的机器学习模型数据,以便它可以找出规则。

这些规则可用于预测新数据的标签。

python人工智能human learn绘图可创建机器学习模型

这很方便,但是在此过程中可能会丢失一些信息。也很难知道引擎盖下发生了什么,以及为什么机器学习模型会产生特定的预测。

除了让机器学习模型弄清楚所有内容之外,还有没有一种方法可以利用我们的领域知识来设置数据标记的规则?

python人工智能human learn绘图可创建机器学习模型

是的,这可以通过 human-learn 来完成。

什么是 human-learn

human-learn 是一种工具,可让你使用交互式工程图和自定义模型来设置数据标记规则。在本文中,我们将探索如何使用 human-learn 来创建带有交互式图纸的模型。

安装 human-learn

pip install human-learn

我将使用来自sklearn的Iris数据来展示human-learn的工作原理。

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
import pandas as pd 
# Load data
X, y = load_iris(return_X_y=True, as_frame=True)
X.columns = ['sepal_length', 'sepal_width', 'petal_length', 'petal_width']
# Train test split
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=1)
# Concatenate features and labels of the training data
train = pd.concat([X_train, pd.DataFrame(y_train)], axis=1)
train

python人工智能human learn绘图可创建机器学习模型

互动绘图

human-learn 允许你绘制数据集,然后使用工程图将其转换为模型。 为了演示这是如何有用的,想象一下如何创建数据集的散点图,如下所示:

python人工智能human learn绘图可创建机器学习模型

查看上面的图时,你会看到如何将它们分成3个不同的区域,如下所示:

python人工智能human learn绘图可创建机器学习模型

但是,可能很难将图形编写为规则并将其放入函数中,human-learn的交互式绘图将派上用场。

from hulearn.experimental.interactive import InteractiveCharts
charts = InteractiveCharts(train, labels='target')
charts.add_chart(x='sepal_length', y='sepal_width')

– 动图01

绘制方法:使用双击开始绘制多边形。然后单击以创建多边形的边。再次双击可停止绘制当前多边形。

我们对其他列也做同样的事情:

charts.add_chart(x='petal_length', y='petal_width')

python人工智能human learn绘图可创建机器学习模型

创建模型并进行预测

一旦完成对数据集的绘制,就可以使用以下方法创建模型:

from hulearn.classification import InteractiveClassifier
model = InteractiveClassifier(json_desc=charts.data())
preds = model.fit(X_train, y_train).predict_proba(X_train)
print(preds.shape) # Output: (150, 3)

cool! 我们将工程图输入InteractiveClassifier类,使用类似的方法来拟合sklearn的模型,例如fit和predict_proba。

让我们来看看pred的前5行:

print('Classes:', model.classes_)
print('Predictions:\n', preds[:5, :])
"""Output
Classes: [1, 2, 0]
Predictions:
 [[5.71326574e-01 4.28530630e-01 1.42795945e-04]
 [2.00079952e-01 7.99720168e-01 1.99880072e-04]
 [2.00079952e-01 7.99720168e-01 1.99880072e-04]
 [2.49812641e-04 2.49812641e-04 9.99500375e-01]
 [4.99916708e-01 4.99916708e-01 1.66583375e-04]]
"""

需要说明的是,predict_proba给出了样本具有特定标签的概率。 例如,[5.71326574e-01 4.28530630e-01 1.42795945e-04]的第一个预测表示样本具有标签1的可能性为57.13%,样本具有标签2的可能性为42.85%,而样本为标签2的可能性为0.014% 该样本的标签为0。

预测新数据

# Get the first sample of X_test
new_sample = new_sample = X_test.iloc[:1]
# Predict
pred = model.predict(new_sample)
real = y_test[:1]
print("The prediction is", pred[0])
print("The real label is", real.iloc[0])

解释结果

为了了解模型如何根据该预测进行预测,让我们可视化新样本。

def plot_prediction(prediction: int, columns: list):
    """Plot new sample
    Parameters
    ----------
    prediction : int
        prediction of the new sample
    columns : list
        Features to create a scatter plot 
    """    
    index = prediction_to_index[prediction] 
    col1, col2 = columns    
    plt.figure(figsize=(12, 3))
    plt.scatter(X_train[col1], X_train[col2], c=preds[:, index])
    plt.plot(new_sample[col1], new_sample[col2], 'ro', c='red', label='new_sample')    
    plt.xlabel(col1)
    plt.ylabel(col2)
    plt.title(f"Label {model.classes_[index]}")
    plt.colorbar()
    plt.legend()

使用上面的函数在petal_length和petal_width绘图上绘制一个新样本,该样本的点被标记为0的概率着色。

plot_prediction(0, columns=['petal_length', 'petal_width'])

python人工智能human learn绘图可创建机器学习模型

其他列也是如此,我们可以看到红点位于具有许多黄点的区域中! 这就解释了为什么模型预测新样本的标签为0。这很酷,不是吗?

预测和评估测试数据

现在,让我们使用该模型来预测测试数据中的所有样本并评估其性能。 开始使用混淆矩阵进行评估:

from sklearn.metrics import confusion_matrix, f1_score
predictions = model.predict(X_test)
confusion_matrix(y_test, predictions, labels=[0,1,2])
array([[13,  0,  0],
       [ 0, 15,  1],
       [ 0,  0,  9]])

我们还可以使用F1分数评估结果:

f1_score(y_test, predictions, average='micro')

结论

刚刚我们学习了如何通过绘制数据集来生成规则来标记数据。 这并不是说你应该完全消除机器学习模型,而是在处理数据时加入某种人工监督。

以上就是python人工智能human learn绘图可创建机器学习模型的详细内容,更多关于human learn绘图创建机器学习模型的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python __setattr__、 __getattr__、 __delattr__、__call__用法示例
Mar 06 Python
python搜索指定目录的方法
Apr 29 Python
Python入门教程之运算符与控制流
Aug 17 Python
python版学生管理系统
Jan 10 Python
python 查找文件名包含指定字符串的方法
Jun 05 Python
Python匿名函数及应用示例
Apr 09 Python
详解python运行三种方式
May 13 Python
python查看文件大小和文件夹内容的方法
Jul 08 Python
python3的print()函数的用法图文讲解
Jul 16 Python
Django+zTree构建组织架构树的方法
Aug 21 Python
python爬虫爬取某网站视频的示例代码
Feb 20 Python
Windows安装Anaconda3的方法及使用过程详解
Jun 11 Python
利用Python实现Picgo图床工具
Nov 23 #Python
python turtle绘图命令及案例
python机器学习Github已达8.9Kstars模型解释器LIME
如何在python中实现ECDSA你知道吗
Python jiaba库的使用详解
Nov 23 #Python
python 中的jieba分词库
Nov 23 #Python
python周期任务调度工具Schedule使用详解
Nov 23 #Python
You might like
PHP网页游戏学习之Xnova(ogame)源码解读(十四)
2014/06/26 PHP
浅析PHP中strlen和mb_strlen的区别
2014/08/31 PHP
php车辆违章查询数据示例
2016/10/14 PHP
php利用嵌套数组拼接与解析json的方法
2017/02/07 PHP
PHP+JS实现的实时搜索提示功能
2018/03/13 PHP
Convert Seconds To Hours
2007/06/16 Javascript
jquery 的 $("#id").html() 无内容的解决方法
2010/06/07 Javascript
ModelDialog JavaScript模态对话框类代码
2011/04/17 Javascript
jQuery提交多个表单的小例子
2013/06/30 Javascript
DeviceOne 让你一见钟情的App快速开发平台
2016/02/17 Javascript
利用PM2部署node.js项目的方法教程
2017/05/10 Javascript
微信小程序的部署方法步骤
2018/09/04 Javascript
Vue 全家桶实现移动端酷狗音乐功能
2018/11/16 Javascript
关于layui 实现点击按钮添加一行(方法渲染创建的table)
2019/09/29 Javascript
解决qrcode.js生成二维码时必须定义一个空div的问题
2020/07/09 Javascript
video.js添加自定义组件的方法
2020/12/09 Javascript
vue动态设置路由权限的主要思路
2021/01/13 Vue.js
vue 组件基础知识总结
2021/01/26 Vue.js
[01:10:24]DOTA2-DPC中国联赛 正赛 VG vs Aster BO3 第一场 2月28日
2021/03/11 DOTA
python 生成目录树及显示文件大小的代码
2009/07/23 Python
用python写asp详细讲解
2013/12/16 Python
对pandas的算术运算和数据对齐实例详解
2018/12/22 Python
Python 类属性与实例属性,类对象与实例对象用法分析
2019/09/20 Python
Python读写锁实现实现代码解析
2020/11/28 Python
css3实现元素环绕中心点布局的方法示例
2019/01/15 HTML / CSS
利用HTML5的新特点实现图片文件异步上传
2014/05/29 HTML / CSS
师范生的个人求职信范文
2014/01/04 职场文书
运动会广播稿60字
2014/01/15 职场文书
优秀企业获奖感言
2014/02/01 职场文书
竞聘书怎么写,如何写?
2014/03/31 职场文书
初中英语演讲稿
2014/04/29 职场文书
挂职锻炼工作总结2015
2015/05/28 职场文书
2015年中学团委工作总结
2015/07/22 职场文书
2016廉洁从业学习心得体会
2016/01/19 职场文书
辞职申请书范本
2019/05/20 职场文书
某某店铺的开业庆典主持词范本
2019/11/25 职场文书