使用 ggTimeSeries 包构建日历图

简介: 使用 ggTimeSeries 包构建日历图

简介

最近和师妹参加一个数据分析大赛,比赛中需要对产品的每天失效数进行可视化。这时,我想起了 GitHub 中的热力图,如下所示:


于是,我打算使用这种热力图/日历图来绘制我的需求。经过搜索,发现了几篇值得参考的文章:

  1. Time-Series Calendar Heatmaps[1]
  2. ggTimeSeries 的 Github 教程[2]
  3. R语言数据可视化之美专业图表绘制指南[3]》第六章

以下为他们所构造出的结果:



来源 1



来源 2



来源 3 中 192 页

和我想象的 GitHub 的不大相同。个人需求是将产品失效个数按照离散形式(极少,少,中,多,极多)划分。并且图形应当更加简洁美观。

于是在学习 {ggTimeSeries} 包后,我打算在他们基础上进行修改。

数据介绍

我们使用模拟数据进行分析,一共生成两列数据:日期以及对应的产品失效等级(a:e)。为了突出产品失效是极少的,所以在抽样(sample())过程中,给 a 类增加抽到的概率。

注意:此类需求还可拓展到其他时间序列中,例如:图书馆书籍日均借阅次数/等级;AQI日均级别等。

# 构建数据
library(tidyverse)
set.seed(20230309)
dtData <- tibble(
  DateCol = seq(
    as.Date("1/01/2020", "%d/%m/%Y"),
    as.Date("31/12/2022", "%d/%m/%Y"), "days"
  ),
  ValueCol = sample(
    c('a', 'b', 'c', 'd', 'e'),
    1096, #根据日期长度确定
    prob = c(0.7, 0.1, 0.1, 0.05, 0.05),
    replace = TRUE
  )
)
head(dtData)



可视化

加载所需的 R 包

library(ggTimeSeries)
library(ggplot2)

初级版本

利用 {ggTimeSeries} 包中的 ggplot_calendar_heatmap() 绘制基于年份的日历图。

p = ggplot_calendar_heatmap(
  dtData,
  'DateCol',
  'ValueCol'
)
p


此时,默认情况下,图形非常丑陋。



细节调整

根据上图存在的问题,我们做一些细节调整,例如:

  1. 变化分面位置;
  2. 改变日历中边缘粗细和颜色;
  3. 修改主题和配色等。

由于这里是离散数据,并且想要复现 GitHub 那种款式。



所以小编使用颜色采集器获取对应颜色代码,并使用 scale_fill_manual() 进行赋值。其他细节如下所示,不做过多说明。读者可以删除对应内容,查看绘图结果,从而判断该参数的功能。

col <- c("#EBEDF0", "#CBE491", "#89C876", "#459944", "#2C602C")
p + 
  scale_fill_manual(values = col) + 
  facet_wrap(~Year, ncol = 1,strip.position = "right") +
  theme( panel.background = element_blank(),
         legend.text = element_blank(),
         panel.border = element_rect(colour="grey60",fill=NA),
         strip.background = element_blank(),
         strip.text = element_text(size=13,face="plain",color="black"),
         axis.line=element_line(colour="black",size=0.25),
         axis.title=element_text(size=10,face="plain",color="black"),
         axis.text = element_text(size=10,face="plain",color="black")) +
  xlab('') + 
  ylab('') +  
  labs(fill = "Freq")



小编有话说

注意:本文的代码(.RMD)已经放到我的 GitHub 中(文末原文直达),有兴趣读者可以下载。此外,往期部分推文代码都已经公开,欢迎大家 Fork,star 使用。


参考资料

[1]

Time-Series Calendar Heatmaps: http://www.columbia.edu/~sg3637/blog/Time_Series_Heatmaps.html

[2]

ggTimeSeries 的 Github 教程: https://exts.ggplot2.tidyverse.org/ggTimeSeries.html

[3]

R语言数据可视化之美专业图表绘制指南: https://github.com/EasyChart/Beautiful-Visualization-with-R

目录
相关文章
|
XML Oracle Java
如何在Java 9以上版本中解决找不到类JAXBException
升级到新的JDK 你会突然发现原来可以运行的项目突然不能启动了, 报形如 Caused by: java.lang.ClassNotFoundException: javax.xml.bind.PropertyException 的类找不到的错。
3087 0
成功解决OSError: Unable to open file (truncated file: eof = 8388608, sblock->base_addr = 0, stored_eof =
成功解决OSError: Unable to open file (truncated file: eof = 8388608, sblock->base_addr = 0, stored_eof =
成功解决OSError: Unable to open file (truncated file: eof = 8388608, sblock->base_addr = 0, stored_eof =
|
10月前
|
缓存 开发工具 开发者
鸿蒙开发:了解构建工具hvigorw
hvigorw作为Hvigor的wrapper包装工具,它的主要作用是,支持自动安装Hvigor构建工具和相关插件依赖,以及执行Hvigor构建命令
506 0
鸿蒙开发:了解构建工具hvigorw
|
安全 物联网 数据安全/隐私保护
UEFI的一点点概识
UEFI的一点点概识
1820 0
|
Linux 开发工具 git
pip的常用命令和常见问题的解决
当使用pip命令安装Python包时,有时候可以通过使用镜像地址来加速下载速度或解决访问限制的问题。以下是一些常用的pip命令和常见的镜像地址:
2426 3
|
API Python
【Python】已解决:urllib.error.HTTPError: HTTP Error 403: Forbidden
【Python】已解决:urllib.error.HTTPError: HTTP Error 403: Forbidden
4087 2
|
域名解析 负载均衡 网络协议
【域名解析DNS专栏】DNS解析中的Anycast技术:原理与优势
【5月更文挑战第27天】Anycast技术是解决DNS解析高效、稳定和安全问题的关键。它将一个IP地址分配给多地服务器,客户端请求自动路由至最近的低负载服务器,减少延迟,提高解析速度。此外,Anycast实现负载均衡,缓解DDoS攻击,并确保高可用性。通过遍历Anycast服务器选择最低延迟者进行DNS解析,实现网络性能优化。随着技术发展,Anycast在DNS解析中的应用将更加广泛。
1235 2
|
机器人
[ROS2] --- action
[ROS2] --- action
691 0
|
机器学习/深度学习 算法 PyTorch
使用Pytorch实现对比学习SimCLR 进行自监督预训练
SimCLR(Simple Framework for Contrastive Learning of Representations)是一种学习图像表示的自监督技术。 与传统的监督学习方法不同,SimCLR 不依赖标记数据来学习有用的表示。 它利用对比学习框架来学习一组有用的特征,这些特征可以从未标记的图像中捕获高级语义信息。
1777 1
|
运维 Python

热门文章

最新文章