编程 Python

python工具dtreeviz决策树可视化和模型可解释性

Posted in Python onMarch 03, 2022

最近逛 Github 时，发现一款非常棒的 dtreeviz 工具库：它用于决策树可视化和模型解释。使用 dtreeviz 可以可视化特征空间如何在决策节点上分割，训练样本如何分布在叶节点中，树如何对特定观察进行预测等等。这些操作对于理解分类或回归决策树的工作方式至关重要。

一、安装

pip install dtreeviz             # install dtreeviz for sklearn
pip install dtreeviz[xgboost]    # install XGBoost related dependency
pip install dtreeviz[pyspark]    # install pyspark related dependency
pip install dtreeviz[lightgbm]   # install LightGBM related dependency

二、用法

dtree：创建决策树可视化的主要功能。给定决策树回归器或分类器，使用 graphviz 创建并返回树可视化。

1.所需的库

导入所需要的基本库

from sklearn.datasets import *
from sklearn import tree
from dtreeviz.trees import *

2.回归决策树

树的默认方向是自上而下，但您可以使用orientation=“LR” 将其更改为从左到右。view() 给出一个带有渲染的 graphviz 对象的弹出窗口。

regr = tree.DecisionTreeRegressor(max_depth=2)
boston = load_boston()
regr.fit(boston.data, boston.target)

viz = dtreeviz(regr,
               boston.data,
               boston.target,
               target_name='price',
               feature_names=boston.feature_names)
              
viz.view()

python工具dtreeviz决策树可视化和模型可解释性

3.分类决策树

分类树需要class_names 的附加参数，给出类值与类名的映射。

classifier = tree.DecisionTreeClassifier(max_depth=2)  # limit depth of tree
iris = load_iris()
classifier.fit(iris.data, iris.target)

viz = dtreeviz(classifier, 
               iris.data, 
               iris.target,
               target_name='variety',
               feature_names=iris.feature_names, 
               class_names=["setosa", "versicolor", "virginica"]  # need class_names for classifier
              )  
              
viz.view()

python工具dtreeviz决策树可视化和模型可解释性

4.预测路径

突出显示参数 X 中传递的单个观察的特征值所在的决策节点。给出观察的特征值并突出树用于遍历路径的特征。

regr = tree.DecisionTreeRegressor(max_depth=2)  # limit depth of tree
diabetes = load_diabetes()
regr.fit(diabetes.data, diabetes.target)
X = diabetes.data[np.random.randint(0, len(diabetes.data)),:]  # random sample from training

viz = dtreeviz(regr,
               diabetes.data, 
               diabetes.target, 
               target_name='value', 
               orientation ='LR',  # left-right orientation
               feature_names=diabetes.feature_names,
               X=X)  # need to give single observation for prediction
              
viz.view()

python工具dtreeviz决策树可视化和模型可解释性

如果只想可视化预测路径，则需要设置参数show_just_path=True

dtreeviz(regr,
        diabetes.data, 
        diabetes.target, 
        target_name='value', 
        orientation ='TD',  # top-down orientation
        feature_names=diabetes.feature_names,
        X=X, # need to give single observation for prediction
        show_just_path=True     
        )

python工具dtreeviz决策树可视化和模型可解释性

5.解释预测路径

这些可视化对于向没有机器学习技能的人解释为什么您的模型做出特定预测很有用。在explain_type=plain_english 的情况下，它在预测路径中搜索并找到特征值范围。

X = dataset[features].iloc[10]
print(X)
Pclass              3.0
Age                 4.0
Fare               16.7
Sex_label           0.0
Cabin_label       145.0
Embarked_label      2.0

print(explain_prediction_path(tree_classifier, X, feature_names=features, explanation_type="plain_english"))
2.5 <= Pclass 
Age < 36.5
Fare < 23.35
Sex_label < 0.5

在explain_type=sklearn_default（仅适用于scikit-learn）的情况下，我们可以仅可视化预测路径中涉及的特征的重要性。特征的重要性是基于杂质的平均减少来计算的。

explain_prediction_path(tree_classifier, X, feature_names=features, explanation_type="sklearn_default")

python工具dtreeviz决策树可视化和模型可解释性

此外我们还可以自定义颜色，比如：

dtreeviz.trees.dtreeviz(regr,
                        boston.data,
                        boston.target,
                        target_name='price',
                        feature_names=boston.feature_names,
                        colors={'scatter_marker': '#00ff00'})

python工具dtreeviz决策树可视化和模型可解释性

到此这篇关于python工具dtreeviz决策树可视化和模型可解释性的文章就介绍到这了,更多相关python工具dtreeviz内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木！

python工具dtreeviz决策树可视化和模型可解释性

- Author -

Python学习与数据挖掘

- Original Sources -

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python下的Mysql模块MySQLdb安装详解

Apr 09 Python

python进阶教程之模块（module）介绍

Aug 30 Python

python实现基于两张图片生成圆角图标效果的方法

Mar 26 Python

Python获取央视节目单的实现代码

Jul 25 Python

python实现得到当前登录用户信息的方法

Jun 21 Python

Python 70行代码实现简单算式计算器解析

Aug 30 Python

使用OpCode绕过Python沙箱的方法详解

Sep 03 Python

对tensorflow中tf.nn.conv1d和layers.conv1d的区别详解

Feb 11 Python

pandas分批读取大数据集教程

Jun 06 Python

Python Tornado核心及相关原理详解

Jun 24 Python

django中ImageField的使用详解

Dec 21 Python

如何用 Python 子进程关闭 Excel 自动化中的弹窗

May 07 Python

Python GUI编程之tkinter 关于 ttkbootstrap 的使用详解

python机器学习实现oneR算法(以鸢尾data为例)

Mar 03 #Python

详解python的异常捕获

Mar 03 #Python

分享提高 Python 代码的可读性的技巧

Mar 03 #Python

使用python创建股票的时间序列可视化分析

Python Pandas读取Excel日期数据的异常处理方法

pytorch中的torch.nn.Conv2d()函数图文详解

Feb 28 #Python

You might like

PHP+SQL 注入攻击的技术实现以及预防办法

2010/12/29 PHP

无法在发生错误时创建会话，请检查 PHP 或网站服务器日志，并正确配置 PHP 安装(win+linux)

2012/05/05 PHP

如何阻止网站被恶意反向代理访问(防网站镜像)

2014/03/18 PHP

PHP表单提交后引号前自动加反斜杠的原因及三种办法关闭php魔术引号

2015/09/30 PHP

Yii的Srbac插件用法详解

2016/07/14 PHP

详解php curl带有csrf-token验证模拟提交方法

2018/04/18 PHP

不间断滚动JS打包类，基本可以实现所有的滚动效果，太强了

2007/12/08 Javascript

jQuery遍历之next()、nextAll()方法使用实例

2014/11/08 Javascript

js实现的黑背景灰色二级导航菜单效果代码

2015/08/24 Javascript

JQuery实现的按钮倒计时效果

2015/12/23 Javascript

jQuery实现图片局部放大镜效果

2016/03/17 Javascript

jQuery实现花式轮播之圣诞节礼物传送效果

2016/12/25 Javascript

浅谈js停止事件冒泡阻止浏览器的默认行为(阻止超连接 #)

2017/02/08 Javascript

jQuery制作input提示内容（兼容IE8以上）

2017/07/05 jQuery

基于Vue的SPA动态修改页面title的方法(推荐)

2018/01/02 Javascript

详解JS函数stack size计算方法

2018/06/18 Javascript

js计算两个日期间的天数月的实例代码

2018/09/20 Javascript

kafka调试中遇到Connection to node -1 could not be established. Broker may not be available.

2019/09/17 Javascript

利用 Chrome Dev Tools 进行页面性能分析的步骤说明(前端性能优化)

2021/02/24 Javascript

python 从远程服务器下载日志文件的程序

2013/02/10 Python

web.py中调用文件夹内模板的方法

2014/08/26 Python

Python实现的简单发送邮件脚本分享

2014/11/07 Python

Django使用httpresponse返回用户头像实例代码

2018/01/26 Python

Bluebella法国官网：英国性感内衣品牌

2019/05/03 全球购物

J2EE是技术还是平台还是框架

2016/08/14 面试题

计算机应用专业毕业生求职信

2013/10/24 职场文书

医学生就业推荐表自我鉴定

2014/03/26 职场文书

建设工地安全标语

2014/06/07 职场文书

企业文化标语大全

2014/06/10 职场文书

2014年纪检部工作总结

2014/11/12 职场文书

2015年度培训工作总结范文

2015/04/02 职场文书

2015年小学生暑假总结

2015/07/13 职场文书

热爱劳动主题班会

2015/08/14 职场文书

《自己的花是让别人看的》教学反思

2016/02/19 职场文书

先进基层党组织事迹材料2016

2016/02/29 职场文书

JavaScript文档对象模型DOM

2021/11/20 Javascript

python工具dtreeviz决策树可视化和模型可解释性

目录

一、安装

二、用法

1.所需的库

2.回归决策树

3.分类决策树

4.预测路径

5.解释预测路径