跟着Nature学作图:R语言ggplot2频率分布直方图和散点图添加误差线

简介: 跟着Nature学作图:R语言ggplot2频率分布直方图和散点图添加误差线

论文

A saturated map of common genetic variants associated with human height

https://www.nature.com/articles/s41586-022-05275-y

s41586-022-05275-y.pdf

代码没有公开,但是作图数据基本都公开了,争取把每个图都重复一遍

今天的推文重复论文中的extended Figure4 频率分布直方图和散点图添加误差线

首先是图a频率分布直方图

library(readxl)
dat<-read_excel("extendFig4.xlsx",
                sheet = "Panel a")
dat

colnames(dat)<-"Var1"
library(ggplot2)
library(ggh4x)


ggplot(data=dat,aes(x=Var1))+
  geom_histogram(bins = 25,
                 color="white",
                 fill="#aadbe9")+
  scale_x_continuous(limits = c(0.5,3),
                     breaks = seq(0.5,3,by=0.5))+
  scale_y_continuous(limits = c(0,300),
                     breaks = seq(0,300,50))+
  geom_vline(xintercept = 0.75,lty="dashed",color="#aadbe9")+
  geom_vline(xintercept = 2.25,lty="dashed",color="#aadbe9")+
  geom_segment(aes(x=2.5,xend=2.5,y=50,yend=0),
               arrow = arrow(),
               color="red")+
  annotate(geom = "text",x=2.5,y=50,label="Observed",
           vjust=-1)+
  geom_segment(aes(x=0.75,xend=2.25,y=250,yend=250),
               arrow = arrow(ends = "both",
                             angle=20,
                             length = unit(3,'mm')),
               color="#aadbe9")+
  annotate(geom = "text",x=1.5,y=250,
           label="Null distribution (1,000 draws)",
           vjust=-1)+
  theme_classic()+
  guides(x=guide_axis_truncated(trunc_lower = 0.5,
                                trunc_upper = 3),
         y=guide_axis_truncated(trunc_lower = 0,
                                trunc_upper = 300))+
  labs(y="Frequency",
       x="Enrichment folde of OMIM genes\nnear GWS SNPs with a density > 1")

image.png

第二个图b

datb<-read_excel("extendFig4.xlsx",
                sheet = "Panel b")
datb
ggplot(data=datb,aes(x=`Minimum Signal Density`,
                     y=`Enrichment statistic`))+
  geom_point()+
  geom_errorbar(aes(ymin=`Enrichment statistic`-`Standard Error of Enrichment Statistic`,
                    ymax=`Enrichment statistic`+`Standard Error of Enrichment Statistic`),
                width=0.4)+
  scale_x_continuous(limits = c(0.5,10.5),
                     breaks = 1:10)+
  scale_y_continuous(limits = c(0,9),
                     breaks = 0:8)+
  theme_classic()+
  guides(x=guide_axis_truncated(trunc_lower = 1,
                                trunc_upper = 10),
         y=guide_axis_truncated(trunc_lower = 0,
                                trunc_upper = 8))+
  labs(x="Minimum Signal Density",
       y="Enrichment-fold of OMIM genes\nnear GWS SNPs")

image.png

最后是拼图

library(patchwork)
p1+p2

image.png

示例数据和代码可以给公众号推文点赞,点击在看,最后留言获取

欢迎大家关注我的公众号

小明的数据分析笔记本

小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!
相关文章
R语言ECM误差修正模型、均衡修正模型、受限VECM、协整检验、单位根检验即期利率市场数据
R语言ECM误差修正模型、均衡修正模型、受限VECM、协整检验、单位根检验即期利率市场数据
R语言分布滞后线性和非线性模型DLM和DLNM建模应用| 系列文章
R语言分布滞后线性和非线性模型DLM和DLNM建模应用| 系列文章
|
11月前
|
数据可视化 数据挖掘 图形学
R语言基础可视化:使用ggplot2构建精美图形的探索
【8月更文挑战第29天】 `ggplot2`是R语言中一个非常强大的图形构建工具,它基于图形语法提供了一种灵活且直观的方式来创建各种统计图形。通过掌握`ggplot2`的基本用法和美化技巧,你可以轻松地将复杂的数据转化为直观易懂的图形,从而更好地理解和展示你的数据分析结果。希望本文能够为你探索`ggplot2`的世界提供一些帮助和启发。
|
11月前
|
数据可视化
R语言自定义图形:ggplot2中的主题与标签设置
【8月更文挑战第30天】`ggplot2`作为R语言中功能强大的绘图包,其自定义能力让数据可视化变得更加灵活和多样。通过合理使用`theme()`函数和`labs()`函数,以及`geom_text()`和`geom_label()`等几何对象,我们可以轻松创建出既美观又富有表达力的图形。希望本文的介绍能够帮助你更好地掌握`ggplot2`中的主题与标签设置技巧。
【R语言实战】——带有新息为标准学生t分布的金融时序的GARCH模型拟合预测
【R语言实战】——带有新息为标准学生t分布的金融时序的GARCH模型拟合预测
|
数据可视化
【R语言实战】——金融时序分布拟合
【R语言实战】——金融时序分布拟合
|
数据处理
R语言GARCH族模型:正态分布、t、GED分布EGARCH、TGARCH的VaR分析股票指数
R语言GARCH族模型:正态分布、t、GED分布EGARCH、TGARCH的VaR分析股票指数
|
10月前
R语言基于表格文件的数据绘制具有多个系列的柱状图与直方图
【9月更文挑战第9天】在R语言中,利用`ggplot2`包可绘制多系列柱状图与直方图。首先读取数据文件`data.csv`,加载`ggplot2`包后,使用`ggplot`函数指定轴与填充颜色,并通过`geom_bar`或`geom_histogram`绘图。参数如`stat`, `position`, `alpha`等可根据需要调整,实现不同系列的图表展示。
199 9
|
机器学习/深度学习 数据可视化
R语言Stan贝叶斯回归置信区间后验分布可视化模型检验|附数据代码
R语言Stan贝叶斯回归置信区间后验分布可视化模型检验|附数据代码
|
前端开发 数据可视化 算法
r语言Bootstrap自助法重采样构建统计量T抽样分布近似值可视化|代码分享
r语言Bootstrap自助法重采样构建统计量T抽样分布近似值可视化|代码分享