灯芯柱状图代码解读

简介: 灯芯柱状图代码解读

简介

这篇推文代码来源于:TidyTuesday[1],主要想学习如何绘制灯芯柱状图(名字小编瞎取的),最终结果如下:

注释:与普通柱状图相比,灯芯柱状图不仅可以展示随时间变化的总体趋势(图中黑色柱子 "Rescues"),而且能够清晰展示灯芯内部数据(图中浅灰色柱子 "cats")相对于总体的比例随时间的变化。

看到最终成品,读者是否可以根据自己所学知识,回答以下几个问题:

  1. 如何实现两个柱状图嵌套?
  2. 如何使得2020年份数据单独显示为粉色?
  3. 如何在柱状图上方添加文字,其中一些文字包括其他单词?

接下来,小编带你解读源代码,并回答以上问题。读者可以根据这些知识要点,灵活应用到其他图形中。

数据介绍

从文件 animal_rescues.txt 中读取数据,并对数据进行预处理,包括分类汇总和计数。

注意:由于时间和文章篇幅原因,数据处理部分不做过多介绍。读者可以根据格式,使用自己比较感兴趣的数据。

library(tidyverse)
library(ggtext)
library(ggrepel)
library(patchwork)
library(systemfonts)
# 数据读取+处理 ========
df_animals <- readr::read_csv('animal_rescues.txt')
df_animals_agg <-
  df_animals %>% 
  mutate(
    animal_group_aggregated = case_when(
      str_detect(animal_group_parent, "Domestic|Livestock|Farm|Horse|Cow|Sheep|Goat|Lamb|Bull") ~ "Other Domestic Animals",
      animal_group_parent %in% c("Cat", "cat") ~ "Cats",
      animal_group_parent %in% c("Bird", "Budgie") ~ "Birds",
      animal_group_parent == "Dog" ~ "Dogs",
      animal_group_parent == "Fox" ~ "Foxes",
      TRUE ~ "Other Wild Animals"
    )
  ) %>% 
  count(cal_year, animal_group_aggregated) %>% 
  group_by(animal_group_aggregated) %>% 
  mutate(
    total = sum(n),
    current = n[which(cal_year == 2021)]
  ) %>% 
  ungroup() %>% 
  mutate(
    animal_group_aggregated = fct_reorder(animal_group_aggregated, total),
    animal_group_aggregated = fct_relevel(animal_group_aggregated, "Other Domestic Animals", after = 0),
    animal_group_aggregated = fct_relevel(animal_group_aggregated, "Other Wild Animals", after = 0)
  )
df_animals_labs <-
  df_animals_agg %>% 
  filter(cal_year == 2016) %>% 
  group_by(animal_group_aggregated) %>% 
  mutate(n = case_when(
    animal_group_aggregated == "Cats" ~ 320,
    animal_group_aggregated %in% c("Birds", "Dogs") ~ 135,
    TRUE ~ 55
  ))
df_animals_annotate <-
  df_animals_agg %>% 
  mutate(label = "\n\n← Number of Rescues in 2021 so far.") %>% 
  filter(cal_year == 2021 & animal_group_aggregated == "Cats")
df_animals_sum <-
  df_animals_agg %>% 
  filter(cal_year < 2021) %>% 
  group_by(cal_year) %>% 
  summarize(n = sum(n))

绘图主要使用 df_animals_sum,以下是该数据预览:

画图

绘图代码使用了 R 中的多个包(tidyverse, ggtext, ggrepel, patchwork, systemfonts)来创建一个特定风格的统计图表。以下是代码的主要步骤和功能:

设置主题和风格:

设置基础主题为 theme_minimal,指定了基本字体大小和字体家族。使用 theme_update 对不同图表元素进行自定义,包括文本样式、轴样式、网格线样式等。

# 主题设置 ====== 
theme_set(theme_minimal(base_size = 19))
# 自定义主题细节
theme_update(
  text = element_text(color = "grey12"),
  axis.title = element_blank(),
  axis.text.x = element_text(),
  axis.text.y = element_blank(),
  panel.grid.major.y = element_blank(),
  panel.grid.minor = element_blank(),
  plot.margin = margin(20, 5, 10, 10),
  plot.subtitle = element_textbox_simple(size = 14, lineheight = 1.6),
  plot.title.position = "plot",
  plot.caption = element_text( color = "#b40059", hjust = .5, size = 10, margin = margin(35, 0, 0, 0))
)

数据可视化

为了更好解读代码中的细节部分,小编将代码进行分解,一步步展示细节内容。完整绘图代码见文末,或者可以在我的 Github[2] 中找到源代码和数据。

  1. 创建一个柱状图 (geom_col) 表示不同年份的动物救援数量。
df_animals_sum %>% 
  ggplot(aes(cal_year, n)) +
  geom_col(aes(fill = factor(cal_year)), width = .85)

  1. 再添加一个柱状图,指定 datafill 参数,并通过修改 width 实现嵌套(问题一答案)。这里数据进行过滤,选择 2021 年前数据,并且选择 animal_group_aggregated == "Cats"。另一个细节:alpha = cal_year == 2020 透明度根据是否 cal_year==2000 进行设置。如果是则 fill = "white"。
geom_col(
    data = df_animals_agg %>% filter(animal_group_aggregated == "Cats" & cal_year < 2021),
    aes(alpha = cal_year == 2020), # 这里有细节!
    fill = "white", width = .5 # 宽度和透明度设置
  )

加入该代码后,绘图结果为:

  1. 使用 geom_text 在图上添加文本标签。对数据进行处理,添加新列文本数据,实现添加其他文字问题三答案df_animals_sum %>% mutate(n_lab = if_else(cal_year %in% c(2009, 2020), paste0(n, "\nRescues"), as.character(n)))
geom_text( #添加文本+加入rescues
    data = df_animals_sum %>% 
      mutate(n_lab = if_else(cal_year %in% c(2009, 2020), paste0(n, "\nRescues"), as.character(n))),
    aes(label = n_lab), size = 4.3, lineheight = .8, 
    nudge_y = 12, vjust = 0, color = "grey12", fontface = "bold"
  ) +
  geom_text( #添加文本+加入cats
    data = df_animals_agg %>% filter(animal_group_aggregated == "Cats" & cal_year < 2021) %>% 
      mutate(n_lab = if_else(cal_year %in% c(2009, 2020), paste0(n, "\nCats"), as.character(n))), 
    aes(label = n_lab), 
    color = "white", lineheight = .8, size = 4.3, 
    nudge_y = 12, vjust = 0, fontface = "bold"
  ) +
  geom_text( # 手动添加年份标签
    data = df_animals_agg %>% filter(animal_group_aggregated == "Cats" & cal_year < 2021),
    aes(y = -15, label = cal_year, color = factor(cal_year)), 
    size = 6, hjust = .5, vjust = 1
  )

  1. 调整图表样式:自定义图表的标题、副标题、图例等元素的样式。通过 scale_fill_manual(values = c(rep("grey30", 11), "#b40059"), guide = "none")  实现手动颜色填充,突出 2020 年数据问题二答案
coord_cartesian(clip = "off") +
  scale_y_continuous(limits = c(-15, NA)) +
  scale_color_manual(values = c(rep("grey30", 11), "#b40059"), guide = "none") +
  scale_fill_manual(values = c(rep("grey30", 11), "#b40059"), guide = "none") +
  scale_alpha_manual(values = c(.25, .4), guide = "none") +
  theme(
    # plot.title = element_markdown(size = 28, margin = margin(5, 35, 25, 35), color = "black"),
    # plot.subtitle = element_textbox_simple(margin = margin(5, 35, 15, 35)),
    panel.grid.major = element_blank(),
    axis.text.x = element_blank()
  )

最终结果如下:

绘图完整代码

df_animals_sum %>% 
  ggplot(aes(cal_year, n)) +
  geom_col(aes(fill = factor(cal_year)), width = .85) +
  geom_col(
    data = df_animals_agg %>% filter(animal_group_aggregated == "Cats" & cal_year < 2021),
    aes(alpha = cal_year == 2020), # 这里有细节!
    fill = "white", width = .5 # 宽度和透明度设置
  ) +
  geom_text( #这里的数据处理:添加文本+加入rescues
    data = df_animals_sum %>% 
      mutate(n_lab = if_else(cal_year %in% c(2009, 2020), paste0(n, "\nRescues"), as.character(n))),
    aes(label = n_lab), size = 4.3, lineheight = .8, 
    nudge_y = 12, vjust = 0, color = "grey12", fontface = "bold"
  ) +
  geom_text( #添加文本+加入cats
    data = df_animals_agg %>% filter(animal_group_aggregated == "Cats" & cal_year < 2021) %>% 
      mutate(n_lab = if_else(cal_year %in% c(2009, 2020), paste0(n, "\nCats"), as.character(n))), 
    aes(label = n_lab), 
    color = "white", lineheight = .8, size = 4.3, 
    nudge_y = 12, vjust = 0, fontface = "bold"
  ) +
  geom_text( # 手动添加年份标签
    data = df_animals_agg %>% filter(animal_group_aggregated == "Cats" & cal_year < 2021),
    aes(y = -15, label = cal_year, color = factor(cal_year)), 
    size = 6, hjust = .5, vjust = 1
  ) +
  coord_cartesian(clip = "off") +
  scale_y_continuous(limits = c(-15, NA)) +
  scale_color_manual(values = c(rep("grey30", 11), "#b40059"), guide = "none") +
  scale_fill_manual(values = c(rep("grey30", 11), "#b40059"), guide = "none") +
  scale_alpha_manual(values = c(.25, .4), guide = "none") +
  theme(
    # plot.title = element_markdown(size = 28, margin = margin(5, 35, 25, 35), color = "black"),
    # plot.subtitle = element_textbox_simple(margin = margin(5, 35, 15, 35)),
    panel.grid.major = element_blank(),
    axis.text.x = element_blank()
  )

参考资料

[1]

TidyTuesday: https://github.com/z3tt/TidyTuesday/blob/main/R/2021_27_AnimalRescues.Rmd

[2]

Github: https://github.com/liangliangzhuang/R_example


目录
相关文章
|
存储 搜索推荐 人机交互
Qt鼠标事件全面解析:从基础到实战
Qt鼠标事件全面解析:从基础到实战
2330 0
|
算法 数据可视化 数据挖掘
课程视频|R语言bnlearn包:贝叶斯网络的构造及参数学习的原理和实例(上)
课程视频|R语言bnlearn包:贝叶斯网络的构造及参数学习的原理和实例
|
算法 编译器 开发者
如何提高Python代码的性能:优化技巧与实践
本文探讨了如何提高Python代码的性能,重点介绍了一些优化技巧与实践方法。通过使用适当的数据结构、算法和编程范式,以及利用Python内置的性能优化工具,可以有效地提升Python程序的执行效率,从而提升整体应用性能。本文将针对不同场景和需求,分享一些实用的优化技巧,并通过示例代码和性能测试结果加以说明。
HTML中font标签用法
这篇文章详细介绍了HTML中`<font>`标签的用法,包括如何分别设置字体风格(`font-style`)、字体粗细(`font-weight`)、字体大小(`font-size`)和字体类型(`font-family`),并通过实例代码演示了如何综合使用这些属性来定义文本的字体样式。
HTML中font标签用法
|
Java
java基础(10)数据类型中的整数类型
Java中的整数类型包括byte、short、int和long。整数字面值默认为int类型,加L表示long类型。整数字面值可以是十进制、八进制(0开头)或十六进制(0x开头)。小容量类型(如int)可自动转换为大容量类型(如long),但大容量转小容量需强制转换,可能导致精度损失。
184 2
|
机器学习/深度学习 并行计算 PyTorch
PyTorch与DistributedDataParallel:分布式训练入门指南
【8月更文第27天】随着深度学习模型变得越来越复杂,单一GPU已经无法满足训练大规模模型的需求。分布式训练成为了加速模型训练的关键技术之一。PyTorch 提供了多种工具来支持分布式训练,其中 DistributedDataParallel (DDP) 是一个非常受欢迎且易用的选择。本文将详细介绍如何使用 PyTorch 的 DDP 模块来进行分布式训练,并通过一个简单的示例来演示其使用方法。
1950 2
|
存储 人工智能 安全
密钥密码学(一)(3)
密钥密码学(一)
385 1
|
人工智能 IDE Devops
通义灵码技术解析,打造 AI 原生开发新范式
本文第一部分先介绍 AIGC 对软件研发的根本性影响,从宏观上介绍当下的趋势;第二部分将介绍 Copilot 模式,第三部分是未来软件研发 Agent 产品的进展。
73717 7
|
设计模式 存储 算法
揭秘模版方法模式-让你的代码既灵活又可维护
本文深入探讨了模板方法模式在软件开发中的应用。开篇通过介绍软件设计的挑战,引出模板方法模式的重要性。随后,文章展示了不使用设计模式实现时存在的问题,并通过一个重构示例,详细阐述了如何使用模板方法模式解决这些问题。本文还深入剖析了模板方法模式的工作原理,总结了其优点和缺点,并提供了最佳实战建议。此外,文章还讨论了模板方法模式与其他设计模式的结合应用,为读者提供了全面的视角来理解和应用这一设计模式。
436 0
揭秘模版方法模式-让你的代码既灵活又可维护
|
Web App开发 存储 前端开发
技术心得记录:前端面试题汇总
技术心得记录:前端面试题汇总