分类回归决策树交互式修剪和更美观地可视化分析细胞图像分割数据集

简介: 分类回归决策树交互式修剪和更美观地可视化分析细胞图像分割数据集

绘制分类或回归树的基本方法的 rpart() 函数只是调用 plot。然而,总的来说,结果并不漂亮。事实证明,一段时间以来,有一种更好的方法来绘制 rpart() 树。

我们可以大概浏览下如何实现,并且进一步研究。

# 绘制分类树图
library(rpart) # 流行的决策树算法
library(party) # 替代决策树算法
library(partykit) # 将rpart对象转换为二叉树
data# 获取一些数据
# 绘制大树
frm <- as.form
tee1 <- rpart
# 
plot# 绘图很混乱
text
# 
pr# 将对树进行绘图
vale=3 # 缩短变量名称
# 对树进行交互式修剪
pp$obj # 以交互方式修剪树形
pp # 显示新的树木
#
#-------------------------------------------------------------------
rpart# 一个更合理的树
prp# 一个快速绘图                                                    
fayRpPot# 花式绘图
#
#-------------------------------------------------------------------
# 绘制一棵用RevoScaleR构建的树
# 构建一个模型公式
names
X <- as.vector
frm <- as.form
# 运行模型
DTree
# 绘制树形图                        
prp
faRaPlt

数据描述

Hill, LaPan, Li和Haney(2007)开发了模型来预测高含量屏幕中哪些细胞被很好地分割。该数据由2019年的119次成像测量组成。最初的分析使用1009个进行训练,1010个作为测试集。

详细内容

结果类别包含在一个名为Class的因子变量中,水平为 "PS "表示分割不良,"WS "表示分割良好。

论文中使用的原始数据可以在Biomedcentral网站上找到。caret < 4.98的版本包含原始数据。现在的版本是经过修改的。首先,一些预测因子的几个离散版本(后缀为 "状态")被删除。第二,有几个最小值为0的倾斜预测因子(将受益于某种转换,如对数)。在这些字段中加入了1的常量值。AvgIntenCh2、FiberAlign2Ch3、FiberAlign2Ch4、SpotFiberCountCh4和TotalIntenCh2。

修剪和绘制树

加载数据后,脚本构建 rpart() 分类树。使用 plot() 绘制树会产生一些覆盖文本的黑云,这是您尝试绘制一棵大树所期望的典型结果。但是,pp() 在绘制树并仅使用默认设置显示其结构方面做得非常好。并且,使用指示 pr() 缩写变量名称的参数使绘图更具可读性。

接下来的几行代码展示了 pp() 的交互式修剪功能。分配对象 new.tree.1 的行 产生一个“实时”树图。使用鼠标修剪树,点击“退出”并重新绘制,您将得到一个相当不错的树顶部绘图。这是将树顶部的清晰图片获取到报告中的巧妙方法。

修剪后绘制更美观的树

tree.2,一个更合理的树,是仅仅接受rpart的结果。首先,使用默认设置使用 pp() 绘制这棵树,然后在下一行中,绘制该树。

此函数只是 pp() 函数的包装,但易于用于绘制分类树,并且是美学如何促进结果可视化交流的一个很好的例子。每个节点框显示分类、该节点上每个类的概率(即以该节点为条件的类的概率)以及该节点使用的观察百分比。请注意虚线的使用如何倾向于强调节点而不是树本身,以及底部的叶子排列如何帮助查看者猜测节点框中的百分比表示到达每个节点的观察百分比节点。(底行增加到 100%)。

脚本的最后几行使用函数构造了一个树,用于构建具有大量数据集的分类和回归树模型。

相关文章
|
存储 Ubuntu 安全
百度搜索:蓝易云【Ubuntu系统离线安装Telnet服务教程。】
确保在进行任何系统配置更改之前备份重要的数据,并在操作过程中小心谨慎,以免造成不必要的问题。
555 0
|
3月前
|
数据采集 存储 人工智能
RAG实战指南:如何让大模型“记得住、答得准、学得快”?
AI博主maoku详解RAG技术:为大模型配备“外接大脑”,解决知识滞后、幻觉编造、专业适配不足三大痛点。文章系统讲解RAG原理、三大开发模式选择、Embedding模型选型、完整实战代码及效果评估,助你快速构建靠谱、可溯源、实时更新的智能问答系统。
|
4月前
|
机器学习/深度学习 数据采集 算法
Python | K折交叉验证的参数优化的GradientBoost及SHAP可解释性分析回归预测算法
本教程介绍基于Python的GradientBoost回归预测算法,结合K折交叉验证与贝叶斯/随机/网格搜索进行超参数优化,并引入SHAP实现模型可解释性分析。涵盖数据预处理、模型训练、多维度评估及可视化,适用于地球科学、医学、工程、经济等多个领域的连续变量预测任务,代码与数据齐全,适合科研与实际应用。
365 2
|
4月前
|
机器学习/深度学习 并行计算 文件存储
机器学习超参数调优:十个实用的贝叶斯优化(Bayesian Optimization)进阶技巧
贝叶斯优化虽强大,但直接使用常面临收敛慢、计算贵等问题。本文总结十大实战技巧:引入先验加速冷启动,动态调整采集函数打破平台期,对数变换处理量级差异,避免超-超参数过拟合,成本感知抑制资源浪费,混合随机搜索提升鲁棒性,并行化利用多GPU,正确编码类别变量,约束无效区域,以及集成代理模型降方差。结合这些策略,让BO更智能、高效,真正发挥超参调优潜力。
554 12
机器学习超参数调优:十个实用的贝叶斯优化(Bayesian Optimization)进阶技巧
|
5月前
|
机器学习/深度学习 算法 数据可视化
Python | 贝叶斯搜索参数优化的XGBoost+SHAP可解释性分析回归预测及可视化算法
本教程将推出Python实现的XGBoost贝叶斯调参+SHAP可解释性分析与可视化,涵盖数据应用、算法原理及SHAP理论,助力SCI论文提升模型可解释性,附完整代码与环境配置指南。
759 7
|
存储 SQL 关系型数据库
PHP与数据库交互:从基础到进阶
【10月更文挑战第9天】在编程的世界里,数据是流动的血液,而数据库则是存储这些珍贵资源的心脏。PHP作为一门流行的服务器端脚本语言,其与数据库的交互能力至关重要。本文将带你从PHP与数据库的基本连接开始,逐步深入到复杂查询的编写和优化,以及如何使用PHP处理数据库结果。无论你是初学者还是有一定经验的开发者,这篇文章都将为你提供宝贵的知识和技巧,让你在PHP和数据库交互的道路上更加从容不迫。
|
11月前
|
算法 Python
Apriori算法的Python实例演示
经过运行,你会看到一些集合出现,每个集合的支持度也会给出。这些集合就是你想要的,经常一起被购买的商品组合。不要忘记,`min_support`参数将决定频繁项集的数量和大小,你可以根据自己的需要进行更改。
418 18
|
数据采集 存储 Web App开发
Python-数据爬取(爬虫)
【7月更文挑战第15天】
1115 3
|
机器学习/深度学习 自然语言处理 算法
ICML 2024 Oral:DPO是否比PPO更适合LLM,清华吴翼团队最新揭秘
【8月更文挑战第13天】在自然语言处理领域,大型语言模型的对齐日益重要。直接偏好优化(DPO)作为无需奖励模型的新方法,虽在学术界受关注,但在实践中,如ChatGPT等应用仍青睐近端策略优化(PPO)。清华大学吴翼团队通过理论分析与实证研究发现DPO潜在局限性,并揭示PPO在LLM微调中取得优异性能的关键因素,如优势归一化、大批量大小及指数移动平均更新等。实验表明,PPO在多个任务中超越DPO,特别是在代码生成任务中取得领先成果。然而,这些发现需更多研究验证。论文详情见: https://arxiv.org/pdf/2404.10719
599 60
|
机器学习/深度学习 数据可视化 Python
Python实用记录(三):通过netron可视化模型
使用Netron工具在Python中可视化神经网络模型,包括安装Netron、创建文件和运行文件的步骤。
412 2
Python实用记录(三):通过netron可视化模型

热门文章

最新文章

下一篇
开通oss服务