使用 ggTimeSeries 包构建日历图

简介: 使用 ggTimeSeries 包构建日历图

简介

最近和师妹参加一个数据分析大赛,比赛中需要对产品的每天失效数进行可视化。这时,我想起了 GitHub 中的热力图,如下所示:


于是,我打算使用这种热力图/日历图来绘制我的需求。经过搜索,发现了几篇值得参考的文章:

  1. Time-Series Calendar Heatmaps[1]
  2. ggTimeSeries 的 Github 教程[2]
  3. R语言数据可视化之美专业图表绘制指南[3]》第六章

以下为他们所构造出的结果:



来源 1



来源 2



来源 3 中 192 页

和我想象的 GitHub 的不大相同。个人需求是将产品失效个数按照离散形式(极少,少,中,多,极多)划分。并且图形应当更加简洁美观。

于是在学习 {ggTimeSeries} 包后,我打算在他们基础上进行修改。

数据介绍

我们使用模拟数据进行分析,一共生成两列数据:日期以及对应的产品失效等级(a:e)。为了突出产品失效是极少的,所以在抽样(sample())过程中,给 a 类增加抽到的概率。

注意:此类需求还可拓展到其他时间序列中,例如:图书馆书籍日均借阅次数/等级;AQI日均级别等。

# 构建数据
library(tidyverse)
set.seed(20230309)
dtData <- tibble(
  DateCol = seq(
    as.Date("1/01/2020", "%d/%m/%Y"),
    as.Date("31/12/2022", "%d/%m/%Y"), "days"
  ),
  ValueCol = sample(
    c('a', 'b', 'c', 'd', 'e'),
    1096, #根据日期长度确定
    prob = c(0.7, 0.1, 0.1, 0.05, 0.05),
    replace = TRUE
  )
)
head(dtData)



可视化

加载所需的 R 包

library(ggTimeSeries)
library(ggplot2)

初级版本

利用 {ggTimeSeries} 包中的 ggplot_calendar_heatmap() 绘制基于年份的日历图。

p = ggplot_calendar_heatmap(
  dtData,
  'DateCol',
  'ValueCol'
)
p


此时,默认情况下,图形非常丑陋。



细节调整

根据上图存在的问题,我们做一些细节调整,例如:

  1. 变化分面位置;
  2. 改变日历中边缘粗细和颜色;
  3. 修改主题和配色等。

由于这里是离散数据,并且想要复现 GitHub 那种款式。



所以小编使用颜色采集器获取对应颜色代码,并使用 scale_fill_manual() 进行赋值。其他细节如下所示,不做过多说明。读者可以删除对应内容,查看绘图结果,从而判断该参数的功能。

col <- c("#EBEDF0", "#CBE491", "#89C876", "#459944", "#2C602C")
p + 
  scale_fill_manual(values = col) + 
  facet_wrap(~Year, ncol = 1,strip.position = "right") +
  theme( panel.background = element_blank(),
         legend.text = element_blank(),
         panel.border = element_rect(colour="grey60",fill=NA),
         strip.background = element_blank(),
         strip.text = element_text(size=13,face="plain",color="black"),
         axis.line=element_line(colour="black",size=0.25),
         axis.title=element_text(size=10,face="plain",color="black"),
         axis.text = element_text(size=10,face="plain",color="black")) +
  xlab('') + 
  ylab('') +  
  labs(fill = "Freq")



小编有话说

注意:本文的代码(.RMD)已经放到我的 GitHub 中(文末原文直达),有兴趣读者可以下载。此外,往期部分推文代码都已经公开,欢迎大家 Fork,star 使用。


参考资料

[1]

Time-Series Calendar Heatmaps: http://www.columbia.edu/~sg3637/blog/Time_Series_Heatmaps.html

[2]

ggTimeSeries 的 Github 教程: https://exts.ggplot2.tidyverse.org/ggTimeSeries.html

[3]

R语言数据可视化之美专业图表绘制指南: https://github.com/EasyChart/Beautiful-Visualization-with-R

目录
相关文章
|
1月前
|
数据可视化 API 数据库
R包:disgenet2r|DisGeNET的懒癌福利,一行代码多种可视化
DisGeNET是一个综合性的数据库,包含大量关于人类基因和疾病关联的信息,常用于生物信息学和基因组学研究。disgenet2r是R语言工具,方便用户访问和分析DisGeNET数据。用户需注册DisGeNET账号并安装R包,通过disgenet2r包可查询、检索基因-疾病关联和变异-疾病关联数据。目前DisGeNET包含超过110万个基因-疾病关联和30万个变异-疾病关联。使用示例包括查询特定疾病相关基因和多疾病联合分析。
21 0
|
4月前
|
数据可视化
ggridges包—峰峦图详细介绍
ggridges包—峰峦图详细介绍
76 0
|
10月前
|
存储 编解码 文件存储
平面设计实验一 新建文件和格式模式转换
平面设计实验一 新建文件和格式模式转换
60 0
|
12月前
|
数据可视化
利用 ggplot2 包绘制高级版本棒棒图
利用 ggplot2 包绘制高级版本棒棒图
106 0
|
12月前
|
算法 PyTorch 算法框架/工具
万文长字总结「类别增量学习」的前世今生、开源工具包(3)
万文长字总结「类别增量学习」的前世今生、开源工具包
280 0
|
12月前
|
存储 算法 数据可视化
万文长字总结「类别增量学习」的前世今生、开源工具包(2)
万文长字总结「类别增量学习」的前世今生、开源工具包
146 0
|
12月前
|
机器学习/深度学习 存储 算法
万文长字总结「类别增量学习」的前世今生、开源工具包(1)
万文长字总结「类别增量学习」的前世今生、开源工具包
|
XML 存储 搜索推荐
一个真实的 SAP 标准 UI5 应用的扩展开发项目(Extension Project)分享 - UI5 界面上新增订单创建者字(1)段
一个真实的 SAP 标准 UI5 应用的扩展开发项目(Extension Project)分享 - UI5 界面上新增订单创建者字段
|
存储 定位技术 Python
python开发:新建矢量数据
python开发:新建矢量数据
|
C# 图形学
Unity之C#高级开发②
Unity之C#高级开发②
Unity之C#高级开发②