R语言在地图上绘制月亮图、饼状图数据可视化果蝇基因种群

简介: R语言在地图上绘制月亮图、饼状图数据可视化果蝇基因种群

月亮图和饼图

饼图把一个圆分成多个部分,这些部分的弧长(以及面积)代表一个整体的比例。月亮图也是如此,它把一个圆分成多个部分,这些部分的面积代表整个圆的比例,但在月亮图中,这些部分被画成圆的月牙形,就像月相。

使用月亮图而不是饼图背后的动机主要是审美的选择。还要注意的是,由于月亮图的各部分是从圆的一侧或另一侧扫过的,所以一般只适合于描述一个或两个群体。

月亮图与Kosara(2019)1的 "圆形切片 "图类似。在研究受试者对不同图表类型中百分比的感知时,"圆形切片 "的表现与饼图类似。月亮图与 "圆形切片 "的不同之处在于,后者是在一个基础圆上滑动第二个同样大小的圆盘,更像是月食而不是月相。然而,两者都依赖面积作为视觉线索。

用法

ggplot2数据可视化包,为R语言中的月亮图提供支持。它们的绘制方式与ggplot2中的点最为相似:它们的位置由一个x和一个y坐标定义,它们的大小与坐标系无关,所以它们总是保持圆形。

ggplot(data.frame(x = 1:5, y = 1)) +

 geom_point(y = 2) +

 scale_size(range = c(5, 10))+

两个新的美学在geom_moon中也很重要:比例和填充

比例美学

比率控制要绘制的月亮的比例。它必须在0("新月",实际上什么都没画)和1("满月",即一个圆)之间。

ggplot(data.frame(x = 1:5, y = 0, ratio = 0:4 * 0.25), aes(x = x, y = y),ratio = ratio), size = 20, fill = "black") +

 geom_text(aes(y = y + 1, label = ratio)) +

填充美学

右边需要一个布尔值,控制月亮是 "升 "还是 "降",也就是说,它是由右边还是左边 "填充 "的。

用两种颜色制作一个 "完整 "的月亮的一种方法是用right = TRUE表示一种颜色,用right = FALSE表示另一种颜色,比例互补。

ggplot( moons) +

 geom(aes(x, y, ratio = ratio, right = right, fill = right)) +

图例关键字

三个关键字,用于不同类型的图例:默认值,绘制一个右边的悬臂月(见上文)。

left从左边画出一个新月,与长臂月互补,这对组合图例很有用。

ggplot(aes(x, y, ratio = ratio, right = right, size = 2^x)) +

 geom(data = subset(moons, right)) +

 geom(

   key = left

 )

key画的是一个圆。它类似于 "点 "的形状,但计算方式略有不同,所以如果你想让图例月亮的尺寸和月亮的尺寸相匹配,就更合适。

ggplot(tidymoons) +

 geom(key = full

 ) +

工作实例

地图上的月亮图

多饼图的一个常见用途是表示地图上不同坐标处的比例。x和y维度已经致力于地图坐标,所以像柱状图这样的比例可视化就比较困难。这是一个尝试月形图的绝佳机会!

饼图地图在人口遗传学中很流行,所以让我们看一下该领域的一个例子。数据包含果蝇种群中Adh基因的两个变体的频率。这些种群中有许多都很接近,所以我们必须处理过度绘制的问题,我们在下面手动处理。

moonmap <- ggplot(da, aes(long, lat)) +

 geom_polygon(

   data = map_data(

     "world"),

   aes(group = group),

 ) +

如果我们想在图例中明确标注等位基因,那么我们需要将它们映射到一个组中,这就要求我们将数据重新排列成一个 "较长"("整齐")的格式。

reshape(

 v.names = "percent",

 times = c("dhF", "dhS"),

 direction = "long"

)

月球数据

有时你只是想绘制月球的文字表述。改编自NASA的月球数据,包含了2019年每天从地球到月球的距离,以及月球四个主要阶段每次出现的日期(UTC)。我们可以用月球图(在这种情况下与饼图相同)绘制这些主要阶段。

ggplot(lunardist, aes(date, distance)) +

 geom_line() +

 # 将下层绘制成一个完整的圆

 geom(data = phase, ratio = 1, size = 5, fill = "black") +

Harvey balls哈维球分析法

"哈维球 "本质上是用于定性比较的饼图,通常以表格形式出现。我们可以使用月形图来达到同样的目的。

首先,让我们获取一些数据。

哈维月亮的图表。

# 首先,我们将数据变化为 "长 "格式,以方便绘图。

rest <- reshape(

 restaurants,

 timevar = "Category",

 direction = "long"

)


ggplot(rest, aes(0, 0)) +

 geom(aes(ratio = (Score - 1) / 4), fill = "black") +

 theme(

   panel.grid = element_blank()

参考文献

  • Kosara, R. 2019. Circular Part-to-Whole Charts Using the Area Visual Cue. EuroVis 2019 - Short Papers. https://doi.org/10.2312/evs.20191163↩︎
  • Oakeshott, J.G., et al. 1982. Alcohol dehydrogenase and glycerol-3-phosphate dehydrogenase clines in Drosophila melanogaster on different continents. Evolution, 36(1): 86-96.↩︎


相关文章
|
21天前
|
机器学习/深度学习 数据采集 人工智能
R语言是一种强大的编程语言,广泛应用于统计分析、数据可视化、机器学习等领域
R语言是一种广泛应用于统计分析、数据可视化及机器学习的强大编程语言。本文为初学者提供了一份使用R语言进行机器学习的入门指南,涵盖R语言简介、安装配置、基本操作、常用机器学习库介绍及实例演示,帮助读者快速掌握R语言在机器学习领域的应用。
47 3
|
3月前
|
数据可视化
R语言可视化设计原则:打造吸引力十足的数据可视化
【8月更文挑战第30天】R语言可视化设计是一个综合性的过程,需要综合运用多个设计原则来创作出吸引力十足的作品。通过明确目标、选择合适的图表类型、合理运用色彩与视觉层次、明确标注与引导视线以及引入互动性与动态效果等原则的应用,你可以显著提升你的数据可视化作品的吸引力和实用性。希望本文能为你提供一些有益的启示和帮助。
|
6月前
|
数据可视化 数据挖掘 索引
R语言层次聚类、多维缩放MDS分类RNA测序(RNA-seq)乳腺发育基因数据可视化|附数据代码2
R语言层次聚类、多维缩放MDS分类RNA测序(RNA-seq)乳腺发育基因数据可视化|附数据代码
|
6月前
|
数据可视化 定位技术
R语言贝叶斯INLA空间自相关、混合效应、季节空间模型、SPDE、时空分析野生动物数据可视化
R语言贝叶斯INLA空间自相关、混合效应、季节空间模型、SPDE、时空分析野生动物数据可视化
|
6月前
|
机器学习/深度学习 数据可视化 算法
R语言聚类分析、因子分析、主成分分析PCA农村农业相关经济指标数据可视化|数据分享
R语言聚类分析、因子分析、主成分分析PCA农村农业相关经济指标数据可视化|数据分享
|
6月前
|
监控 数据可视化 数据挖掘
R语言质量控制图、质量管理研究分析采购订单数量、CPU时间、纸厂产出、钢板数据可视化
R语言质量控制图、质量管理研究分析采购订单数量、CPU时间、纸厂产出、钢板数据可视化
|
6月前
|
存储 数据可视化 数据挖掘
R语言层次聚类、多维缩放MDS分类RNA测序(RNA-seq)乳腺发育基因数据可视化|附数据代码1
R语言层次聚类、多维缩放MDS分类RNA测序(RNA-seq)乳腺发育基因数据可视化|附数据代码
|
6月前
|
数据可视化
R语言平稳性ADF检验、ARCH-LM效应检验分析收盘价收益率数据可视化
R语言平稳性ADF检验、ARCH-LM效应检验分析收盘价收益率数据可视化
|
6月前
|
数据可视化
R语言PLS-DA模型分析不同中医组别患者间差异指标数据可视化
R语言PLS-DA模型分析不同中医组别患者间差异指标数据可视化
|
6月前
|
存储 数据可视化
R语言软件套保期限GARCH、VAR、OLS回归模型对沪深300金融数据可视化分析
R语言软件套保期限GARCH、VAR、OLS回归模型对沪深300金融数据可视化分析

热门文章

最新文章