简介
最近在科研中需要比较不同模型的预测性能,我们使用相对偏差,均方根误差等来比较结果。此时,可能会得到以下结果:
上图出现以下问题:
- 问题一:由于经典模型(Normal)在复杂数据中的预测效果不好,会出现预测非常差的情况,从而导致图形Y轴刻度被拉长,可视化效果不佳。
- 问题二:相似方法预测结果相同,无法清晰看出之间的差异性。
- 问题三:柱状图准确数字未知,只能通过主观方式估计最终结果。
基于以上问题,小编分别做了以下润色工作:
- 问题一二可以通过使用 ggbreak 包[1] 进行多次 Y 轴截断。
- 添加每个柱状图的准确数值结果来解决问题三。
- 简单修改图形颜色,删除图例,使其变得更加美观。
最后得到以下图形:
接下来给出可复现的代码供大家参考,读者可以根据自己数据进行调整。
使用教程
数据产生
为了方便读者复现,小编手动产生一些样例数据:
com_cost = c(17.64,4.89,5.13,8.43,5.32) com_cost_re = data.frame("Method" = c("Normal","TS","Linear","Power","Exp"),"Value"= round(com_cost,3)) com_cost_re$Method <- factor(com_cost_re$Method, levels = c("Normal","Power","Exp","Linear","TS"))
可视化
首先,对该数据进行可视化,并做了些细节调整。例如:修改配色、添加文本、删除图例等。
gg1 = ggplot(com_cost_re, aes(x = Method, y = Value)) + geom_bar(stat = "identity", aes(fill = Method),alpha = 0.8) + scale_fill_viridis(discrete = T)+ # 修改配色 geom_text(aes(label = Value), position = position_dodge(width = 0.8), vjust = 2, size = 4,color = "white") + # 添加文本 coord_cartesian(ylim = c(4,18)) + theme_bw() + # 设置主题 theme(panel.grid = element_blank(),legend.position = "none") + # 删除图例 labs(title = "", x = "Method", y = "Criteria") gg1
此时,图形美观度基本完成,接下来使用 ggbreak 包进行多次 Y 轴截断。主要使用 scale_y_break()
函数。
注意:关于
scale_y_break()
的其他参数设置可参考:ggbreak官网教程[2],这里不做过多重复介绍。
gg2 = gg1 + scale_y_break(c(5.35, 8.34)) + scale_y_break(c(0, 4.7)) + scale_y_break(c(8.5, 17.5))
此时得到的结果为:
小编有话说
本文主要是小编在科研中存在的一个问题,最终通过一些简单搜索和调包解决问题。供大家参考~
参考资料
[1]
ggbreak 包: https://github.com/YuLab-SMU/ggbreak
[2]
ggbreak官网教程: https://cran.r-project.org/web/packages/ggbreak/vignettes/ggbreak.html