跟着Nature学作图:R语言ggplot2散点图和柱形图完整示例(Extended Fig3)

简介: 跟着Nature学作图:R语言ggplot2散点图和柱形图完整示例(Extended Fig3)

论文

A saturated map of common genetic variants associated with human height

https://www.nature.com/articles/s41586-022-05275-y

s41586-022-05275-y.pdf

代码没有公开,但是作图数据基本都公开了,争取把每个图都重复一遍

今天的推文重复论文中的extended Figure3

image.png

散点图的部分示例数据

image.png

作图代码

library(readxl)
dat01<-read_excel("extendFig3.xlsx",
                  sheet = "Panel a")
colnames(dat01)<-c("X","Y")
head(dat01)
library(tidyverse)
dat01 %>% 
  mutate(group.info=
           case_when(
             X > 0.8 & Y > 3 ~ "A",
             X > 0.8 & Y < 3 ~ "B",
             TRUE ~ "D"
           )) -> new.dat01

library(ggplot2)
library(ggh4x)
library(latex2exp)
p1<-ggplot(data=new.dat01,aes(x=X,y=Y))+
  geom_point(aes(color=group.info),
             size=3,
             show.legend = FALSE)+
  scale_color_manual(values = c("A"="#83ee81",
                                "B"="#fe6c55",
                                "D"="black"))+
  geom_point(data=new.dat01 %>% filter(group.info!="D"),
             size=1.5)+
  theme_classic()+
  scale_y_continuous(breaks = c(0,3,10,20,30))+
  scale_x_continuous(breaks = seq(0,1,by=0.2))+
  geom_vline(xintercept = 0.8,color="red",
             lty="dashed")+
  geom_hline(yintercept = 3,color="red",
             lty="dashed")+
  guides(x=guide_axis_truncated(trunc_lower = 0,
                                trunc_upper = 1),
         y=guide_axis_truncated(trunc_lower = 0,
                                trunc_upper = 30))+
  labs(x="Expected Sttistical Power for Replication",
       y=TeX(r"(-log${_1}{_0}$\times sign(\beta$_{DISCOVERY}$)\times sign(\beta$_{REPLICATION}$))"))

p1

image.png

柱形图的示例数据

image.png

作图代码

dat02<-read_excel("extendFig3.xlsx",
                  sheet = "Panel b",
                  skip = 1)
dat02 %>% 
  mutate(newCol=letters[1:7]) -> new.dat02
colnames(new.dat02)

ggplot(data=data.frame(x=c("A","B"),
                       y=10),
       aes(x=x,y=y))+
  geom_col(aes(fill=x))+
  scale_fill_manual(values = c("A"="#02178c",
                               "B"="#dba425"),
                    labels=c("A"="Observed",
                             "B"="Expected"))+
  theme(legend.title = element_blank()) -> p2.legend

p2<-ggplot(data=new.dat02,aes(x=newCol,y=Observed))+
  geom_col(fill="#02178c")+
  geom_errorbar(aes(ymin=Observed-`Standard Error of Observed proportion`,
                    ymax=Observed+`Standard Error of Observed proportion`),
                color="#ff6c57",
                width=0.2)+
  geom_segment(aes(x=c(1:7)-0.4,xend=c(1:7)+0.4,
                   y=Expected,yend=Expected),
               color="#daa421")+
  theme_classic()+
  scale_y_continuous(expand = expansion(mult = c(0,0)),
                     breaks = c(0,0.27,0.54,0.8),
                     labels = c("50%","60%","70%","80%"))+
  scale_x_discrete(labels=new.dat02$`Minor Allele Frequency Class`)+
  theme(axis.line.x = element_blank(),
        axis.ticks.x = element_blank(),
        axis.text.x = element_text(angle=90,hjust=1))+
  labs(x="MAF range in Estonian Biobank (EBB)",
       y="Proportion of SNPs with sign-consistent effect\nsizes between discovery and replication")
p2
p2+theme(plot.margin = unit(c(1.5,0.1,0.1,0.1),'cm'))+
  annotation_custom(grob = ggpubr::get_legend(p2.legend),
                    xmin = 1.5,xmax = 1.5,
                    ymin = 0.9,ymax=0.9) -> p2.1
p2.1

image.png

最后是拼图

library(patchwork)

p1+p2.1

image.png

示例数据和代码可以给推文点赞 点击在看 最后留言获取

欢迎大家关注我的公众号

小明的数据分析笔记本

小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!
相关文章
|
5月前
|
存储
【视频】R语言中的分布滞后非线性模型(DLNM)与发病率,死亡率和空气污染示例
【视频】R语言中的分布滞后非线性模型(DLNM)与发病率,死亡率和空气污染示例
|
5月前
R语言中编写最小工作示例(MWRE)
R语言中编写最小工作示例(MWRE)
|
5月前
|
编译器 Python Windows
R语言RStan贝叶斯示例:重复试验模型和种群竞争模型Lotka Volterra
R语言RStan贝叶斯示例:重复试验模型和种群竞争模型Lotka Volterra
|
5月前
R语言RStan贝叶斯示例:重复试验模型和种群竞争模型Lotka Volterra2
R语言RStan贝叶斯示例:重复试验模型和种群竞争模型Lotka Volterra
R语言绘制组间比较散点图并自动添加P值信息
查询ggprism包使用时候发现官网给出的一示例图比较常用,这里记录学习一下。
205 3
|
数据处理
R语言-数据处理:dplyr包内 mutate-across 联用示例
mutate和across函数是dplyr中非常常用的函数,它们可以帮助我们快速、高效地对数据进行处理和分析。本文分享了联用这两个函数处理数据的基本用法示例,熟练掌握这些函数的用法,可以大大提高我们的数据处理效率。
418 0
|
机器学习/深度学习 移动开发 数据挖掘
R语言- data.table包加速大型数据集的加载和运算效率用法示例
本文根据个人使用经验和博客参考,总结分享了在R语言中使用data.table包来提升大型数据集处理效率的用法示例,以供参考
241 0
|
数据挖掘 数据格式
R语言- ComplexHeatmap 绘制复杂热图示例
ComplexHeatmap是R语言中用于绘制复杂热图的一个重要包。它提供了一种灵活、高效、易于定制的方法来绘制热图,并支持多种数据类型和数据格式,支持包括多种热图类型,包括基本热图、聚类热图、分组热图、矩阵热图等。用户可以根据自己的需求选择不同的热图类型,并进行灵活的定制。在生物信息学、医学、生态学等领域得到广泛应用。 本文将通过一个复杂热图的创建示例分享 ComplexHeatmap的语法规则。
743 0
|
数据可视化 数据挖掘 定位技术
跟着Nature Communications学作图:R语言ggplot2画世界地图并用md语法添加文字标签
跟着Nature Communications学作图:R语言ggplot2画世界地图并用md语法添加文字标签

热门文章

最新文章

下一篇
无影云桌面