在拿到一份数据后常需要对数据进行简单的探索分析,今天来学习一个新的数据诊断R包——dlookr包。该包可以说是 读者求助|利用 R Markdown 批量制作数据分析报告 的拓展。
这个包中的函数很多,简单介绍下里面一个不错的函数。
1. 安装和加载R包
安装可以直接从CRAN上安装。
install.packages("dlookr") library(dlookr)
2. 输出数据诊断报告
使用这个包中的eda_report()可以输出一份数据诊断报告。
最简单的用法就是将数据集的名称放入函数即可。
eda_report(heartfailure)
运行代码即可在本地端生成一份数据诊断报告。
数据量越大,诊断报告数据越多。
可以往下拉看数据诊断报告的详细内容。
可以加个分组变量。
eda_report(heartfailure, target = death_event)
会在后面添加一组分组变量的诊断报告内容。
这个包中还有一些不错的函数,包括缺失值、异常值的探索、处理,有兴趣的可以看看。
参考资料
- dlookr包帮助文件