决策树可视化,被惊艳到了!

简介: 决策树可视化,被惊艳到了!

目前无论是机器学习竞赛还是工业界,最流行、应用最广泛的xgboost其实是优化后的GBDT(LightGBM里面的boosting比较经典稳定的也是GBDT哦!),而GBDT的基分类器最常用的就是CART决策树!掌握决策树,对理解之后的GBDT、LightGBM都有大有裨益。


可视化的方式理解决策树,对深刻理解这个模型很有帮助。大家最熟知的决策树可视化实现方式是下面这种:


dot_data = export_graphviz(
    clf,
    out_file=None,
    feature_names=df.columns[:-1],
    class_names=["good", "bad"],
    filled=True,
    rounded=True,
    special_characters=True,
)
graph2 = pydotplus.graph_from_dot_data(dot_data)
graph2.write_png("./pics/tree.png")


640.png


这种方法很好地展示了树的结构,但并不完美:


1、基尼系数会占用图中的空间,并且不利于解释

2、每个节点中各目标类别的样本数不够直观


今天向大家介绍一个更为惊艳的决策树可视化库——dtreeviz  ,我们直接看几张效果图

640.png

640.png

640.png


dtreeviz有以下特色:


  • 利用有颜色的目标类别图例
  • 叶子大小与该叶子中的样本数成正比
  • 将≥和<用作边缘标签,看起来更清晰
  • 决策节点利用堆叠直方图展示特征分布,每个目标类别都会用不同的颜色显示
  • 在每个节点中各目标类别的样本数都用直方图的形式,这样可以提供更多信息


dtreeviz同样依赖GraphViz,其安装配置方法可以参考我之前的文章(点击直达:决策树的可视化


GraphViz 搞定后,安装dtreeviz即可


pip install dtreeviz             # install dtreeviz for sklearn
pip install dtreeviz[xgboost]    # install XGBoost related dependency
pip install dtreeviz[pyspark]    # install pyspark related dependency
pip install dtreeviz[lightgbm]   # install LightGBM related dependency


使用也很简单

640.png

640.png




相关文章
|
机器学习/深度学习 数据挖掘
这图怎么画| 一个用于展示多种机器学习模型结果的热图
这图怎么画| 一个用于展示多种机器学习模型结果的热图
158 0
|
7月前
|
算法 数据可视化 数据挖掘
【数据挖掘】密度聚类DBSCAN讲解及实战应用(图文解释 附源码)
【数据挖掘】密度聚类DBSCAN讲解及实战应用(图文解释 附源码)
608 1
|
6月前
|
机器学习/深度学习 数据可视化 算法
【阿旭机器学习实战】【36】糖尿病预测---决策树建模及其可视化
【阿旭机器学习实战】【36】糖尿病预测---决策树建模及其可视化
|
7月前
|
机器学习/深度学习 监控 数据可视化
Scikit-learn与可视化:让机器学习结果更直观
【4月更文挑战第17天】本文探讨了如何使用Scikit-learn和可视化工具使机器学习结果更直观。Scikit-learn作为Python的开源机器学习库,结合Matplotlib、Seaborn等可视化库,便于数据探索、模型训练过程监控及结果展示。通过示例代码,展示了数据探索的pairplot、模型训练准确率曲线的绘制以及聚类结果的散点图,强调了可视化在提升模型理解度和应用普及性上的作用。随着可视化技术进步,机器学习将变得更直观易懂。
|
7月前
|
机器学习/深度学习 数据采集 数据可视化
R语言SVM模型文本挖掘分类研究手机评论数据词云可视化
R语言SVM模型文本挖掘分类研究手机评论数据词云可视化
|
7月前
|
数据采集 机器学习/深度学习 数据可视化
R语言贝叶斯模型预测电影评分数据可视化分析
R语言贝叶斯模型预测电影评分数据可视化分析
|
7月前
|
机器学习/深度学习 自然语言处理 数据可视化
数据分享|R语言豆瓣数据文本挖掘 神经网络、词云可视化和交叉验证
数据分享|R语言豆瓣数据文本挖掘 神经网络、词云可视化和交叉验证
|
7月前
|
机器学习/深度学习 算法 大数据
【Python机器学习】决策树与随机森林的讲解及决策树在决策决策问题中实战(图文解释 附源码)
【Python机器学习】决策树与随机森林的讲解及决策树在决策决策问题中实战(图文解释 附源码)
81 0
|
机器学习/深度学习 数据可视化 算法
【机器学习3】鸢尾花数据集可视化,让枯燥的数据颜值爆表!
【机器学习3】鸢尾花数据集可视化,让枯燥的数据颜值爆表!
1400 0
|
数据可视化
ggballoonplot|气球图-多分类数据可视化
ggballoonplot|气球图-多分类数据可视化
160 0