跟着Nature Metabolism学作图:R语言ggplot2柱形图和下三角热图完整示例

简介: 跟着Nature Metabolism学作图:R语言ggplot2柱形图和下三角热图完整示例

论文

Single-cell profiling of vascular endothelial cells reveals progressive organ-specific vulnerabilities during obesity

https://www.nature.com/articles/s42255-022-00674-x#Sec58

s42255-022-00674-x.pdf

https://github.com/Osynchronika/sc_EC_obesity_atlas

大部分 作图的数据都有,可以试着用论文中提供的数据复现一下论文中的图

今天的推文重复一下论文中的Figure1e 柱形图 和 Figure1f的下三角热图

Figure1e的数据论文中是提供的,格式如下

image.png

这是3个柱形图的数据,需要我们手动整理成作图格式

image.png

柱形图的作图代码

df02<-read_excel("data/20230207/42255_2022_674_MOESM3_ESM.xlsx",
                 sheet = "Sheet1")
df02
df02$x<-factor(df02$x,levels = df02$x)

pe1<-ggplot()+
  geom_col(data=df02,aes(x=x,y=y),
           fill="red",color="black")+
  theme_classic()+
  scale_y_continuous(expand = expansion(mult=c(0,0)),
                     limits = c(0,120),
                     breaks = seq(0,120,20))+
  labs(x=NULL,y="Number of DEGs",title="Art")+
  theme(plot.title = element_text(hjust=0.5,face="bold"))


df03<-read_excel("data/20230207/42255_2022_674_MOESM3_ESM.xlsx",
                 sheet = "Sheet2")
df03
df03$x<-factor(df03$x,levels = df03$x)

pe2<-ggplot()+
  geom_col(data=df03,aes(x=x,y=y),
           fill="#46b198",color="black")+
  theme_classic()+
  scale_y_continuous(expand = expansion(mult=c(0,0)),
                     limits = c(0,900),
                     breaks = seq(0,900,300))+
  labs(x=NULL,y="Number of DEGs",title="Cap")+
  theme(plot.title = element_text(hjust=0.5,face="bold"))


df04<-read_excel("data/20230207/42255_2022_674_MOESM3_ESM.xlsx",
                 sheet = "Sheet3")
df04
df04$x<-factor(df04$x,levels = df04$x)

pe3<-ggplot()+
  geom_col(data=df04,aes(x=x,y=y),
           fill="#4472c4",color="black")+
  theme_classic()+
  scale_y_continuous(expand = expansion(mult=c(0,0)),
                     limits = c(0,350),
                     breaks = seq(0,350,50))+
  labs(x=NULL,y="Number of DEGs",title="Ven")+
  theme(plot.title = element_text(hjust=0.5,face="bold"))

三个柱形图的代码基本一样

image.png

下三角相关系数热图

这个论文中没有提供数据,我手动整理下来了格式如下

image.png

作图代码

library(readxl)
library(ggplot2)
library(tidyverse)
library(paletteer)
library(latex2exp)

df<-read_excel("data/20230207/figure1f.xlsx")
x_axis<-c('Brain','Heart','Lungs','Kidney','Liver','Vis AT')
y_axis<-c('Sc AT','Vis AT','Liver','Kidney','Lungs','Heart')

table(df$var1)
table(df$var2)


df<-df %>% 
  mutate(var1=factor(var1,levels = x_axis),
         var2=factor(var2,levels = y_axis))

txt.df<-data.frame(x=1:7,
                   y=7:1,
                   label=c('Brain','Heart','Lungs','Kidney','Liver','Vis AT','Sc AT'))
p1<-ggplot(data=df,aes(x=var1,y=var2))+
  geom_tile(aes(fill=value),
            color="black")+
  geom_text(aes(label=value))+
  geom_text(data=txt.df,
            aes(x=x,y=y,label=label))+
  #scale_x_discrete(expand = expansion(mult = c(0,0)))+
  #scale_y_discrete(expand = expansion(mult = c(0,0)))+
  theme_bw()+
  theme(axis.text = element_blank(),
        axis.ticks = element_blank(),
        panel.grid = element_blank(),
        panel.border = element_blank(),
        legend.position = "left",
        axis.title = element_blank())+
  coord_cartesian(xlim = c(0,8),y=c(0,7))+
  scale_fill_gradient2(low="blue",
                       mid="white",
                       high="red",
                       breaks=c(-0.11,0,0.17),
                       name=TeX(r"(\textit{r} value)"),
                       midpoint=0)+
  guides(fill=guide_colorbar(barheight = 10,
                             ticks.colour = "black"))

p1

image.png

怎么把图例做成和论文中的一样我暂时想不到了,ggplot2这个这个图例好像只能是最小值和最大值,比如现在最大值是0.17,我先让图例映射到1,这个好像实现不了

做三个一样的,然后拼图

p1+
  labs(title="Art")+
  theme(plot.title = element_text(hjust=0.5,
                                  face="bold",
                                  size=20)) -> pA


p1+
  labs(title="Cap")+
  theme(plot.title = element_text(hjust=0.5,
                                  face="bold",
                                  size=20),
        legend.position = "none") -> pB

p1+
  labs(title="Ven")+
  theme(plot.title = element_text(hjust=0.5,
                                  face="bold",
                                  size=20),
        legend.position = "none") ->pC

library(patchwork)

pA+pB+pC

然后将柱形图和热图拼到一起

(pe1+pe2+pe3)/(pA+pB+pC)

image.png

示例数据和代码可以给推文点赞,然后点击在看,最后留言获取

欢迎大家关注我的公众号

小明的数据分析笔记本

小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!
相关文章
|
数据可视化 数据挖掘 定位技术
跟着Nature Communications学作图:R语言ggplot2画世界地图并用md语法添加文字标签
跟着Nature Communications学作图:R语言ggplot2画世界地图并用md语法添加文字标签
|
数据可视化 数据挖掘 Python
跟着Oncogene学作图:R语言gggenomes画桑基图
跟着Oncogene学作图:R语言gggenomes画桑基图
|
数据可视化 数据挖掘 Python
跟着NatureCommunications学作图:R语言ggtree根据分组给进化树上色
跟着NatureCommunications学作图:R语言ggtree根据分组给进化树上色
|
2月前
|
数据采集 机器学习/深度学习 数据可视化
R语言从数据到决策:R语言在商业分析中的实践
【9月更文挑战第1天】R语言在商业分析中的应用广泛而深入,从数据收集、预处理、分析到预测模型构建和决策支持,R语言都提供了强大的工具和功能。通过学习和掌握R语言在商业分析中的实践应用,我们可以更好地利用数据驱动企业决策,提升企业的竞争力和盈利能力。未来,随着大数据和人工智能技术的不断发展,R语言在商业分析领域的应用将更加广泛和深入,为企业带来更多的机遇和挑战。
|
8天前
|
数据挖掘 C语言 C++
R语言是一种强大的统计分析工具,提供了丰富的函数和包用于时间序列分析。
【10月更文挑战第21天】时间序列分析是一种重要的数据分析方法,广泛应用于经济学、金融学、气象学、生态学等领域。R语言是一种强大的统计分析工具,提供了丰富的函数和包用于时间序列分析。本文将介绍使用R语言进行时间序列分析的基本概念、方法和实例,帮助读者掌握R语言在时间序列分析中的应用。
27 3
|
6月前
|
数据可视化 数据挖掘 API
【R语言实战】聚类分析及可视化
【R语言实战】聚类分析及可视化
|
6月前
|
机器学习/深度学习 数据可视化
R语言逻辑回归logistic模型ROC曲线可视化分析2例:麻醉剂用量影响、汽车购买行为2
R语言逻辑回归logistic模型ROC曲线可视化分析2例:麻醉剂用量影响、汽车购买行为
|
2月前
|
数据采集 数据可视化 数据挖掘
R语言在金融数据分析中的深度应用:探索数据背后的市场智慧
【9月更文挑战第1天】R语言在金融数据分析中展现出了强大的功能和广泛的应用前景。通过丰富的数据处理函数、强大的统计分析功能和优秀的可视化效果,R语言能够帮助金融机构深入挖掘数据价值,洞察市场动态。未来,随着金融数据的不断积累和技术的不断进步,R语言在金融数据分析中的应用将更加广泛和深入。
|
3月前
|
机器学习/深度学习 数据采集 数据可视化
R语言在数据科学中的应用实例:探索与预测分析
【8月更文挑战第31天】通过上述实例,我们展示了R语言在数据科学中的强大应用。从数据准备、探索、预处理到建模与预测,R语言提供了完整的解决方案和丰富的工具集。当然,数据科学远不止于此,随着技术的不断发展和业务需求的不断变化,我们需要不断学习和探索新的方法和工具,以更好地应对挑战,挖掘数据的潜在价值。 未来,随着大数据和人工智能技术的普及,R语言在数据科学领域的应用将更加广泛和深入。我们期待看到更多创新的应用实例,为各行各业的发展注入新的动力。
|
3月前
|
数据采集 存储 数据可视化
R语言时间序列分析:处理与建模时间序列数据的深度探索
【8月更文挑战第31天】R语言作为一款功能强大的数据分析工具,为处理时间序列数据提供了丰富的函数和包。从数据读取、预处理、建模到可视化,R语言都提供了灵活且强大的解决方案。然而,时间序列数据的处理和分析是一个复杂的过程,需要结合具体的应用场景和需求来选择合适的方法和模型。希望本文能为读者在R语言中进行时间序列分析提供一些有益的参考和启示。