dlookr包,自动输出一份数据诊断报告

简介: dlookr包,自动输出一份数据诊断报告

在拿到一份数据后常需要对数据进行简单的探索分析,今天来学习一个新的数据诊断R包——dlookr包。该包可以说是 读者求助|利用 R Markdown 批量制作数据分析报告 的拓展。

这个包中的函数很多,简单介绍下里面一个不错的函数。

1. 安装和加载R包

安装可以直接从CRAN上安装。

install.packages("dlookr")
library(dlookr)

2. 输出数据诊断报告

使用这个包中的eda_report()可以输出一份数据诊断报告。

最简单的用法就是将数据集的名称放入函数即可。

eda_report(heartfailure)

运行代码即可在本地端生成一份数据诊断报告。

数据量越大,诊断报告数据越多。

可以往下拉看数据诊断报告的详细内容。

可以加个分组变量。

eda_report(heartfailure, target = death_event)

会在后面添加一组分组变量的诊断报告内容。

这个包中还有一些不错的函数,包括缺失值、异常值的探索、处理,有兴趣的可以看看。

参考资料

  1. dlookr包帮助文件



目录
打赏
0
0
0
0
13
分享
相关文章
K8S client-go Patch example
我在本文中主要会介绍使用client-go的Patch方式,主要包括strategic merge patch和json-patch
框架和库:你需要知道的一切
框架和库:你需要知道的一切
163 0
设计团队总监如何通过文档管理工具简化文件共享与团队协作流程
设计团队不仅需创造优质视觉与交互设计,还需高效管理项目进度、文件资源及跨团队协作。合理的文档管理工具对提升团队效率、优化协作流程、确保项目按时高质量交付至关重要。本文介绍了六款适合设计团队的文档管理工具,涵盖Banli Kanban、Figma、Dropbox Paper、Notability、Lucidchart和ProofHub,详细分析了它们的特点、优势及适用场景。
设计团队总监如何通过文档管理工具简化文件共享与团队协作流程
【机器学习】在使用K-means聚类算法时,如何选择K的值?
【5月更文挑战第11天】【机器学习】在使用K-means聚类算法时,如何选择K的值?
OSPF的网络设计原则
OSPF的网络设计原则
141 3
R语言时间序列平稳性几种单位根检验(ADF,KPSS,PP)及比较分析
R语言时间序列平稳性几种单位根检验(ADF,KPSS,PP)及比较分析
基因组组装:Hifiasm 使用教程
基因组组装:Hifiasm 使用教程
如何理解Mysql的索引及他们的原理--------二叉查找树和平衡二叉树和B树和B+树
如何理解Mysql的索引及他们的原理--------二叉查找树和平衡二叉树和B树和B+树
153 0
云服务器 CPU 使用率高的问题排查与优化
云服务器 CPU 使用率高的问题排查与优化
752 0
登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问