跟着NatureCommunications学作图:R语言ggtree根据分组给进化树上色

简介: 跟着NatureCommunications学作图:R语言ggtree根据分组给进化树上色

论文

MiDAS 4: A global catalogue of full-length 16S rRNA gene sequences and taxonomy for studies of bacterial communities in wastewater treatment plants

https://www.nature.com/articles/s41467-022-29438-7

数据链接

https://figshare.com/articles/dataset/Dueholm2021a_data_zip/16566408/1

代码链接

https://github.com/msdueholm/MiDAS4

今天的推文我们重复一下论文中的Figure2

image.png

我试了下论文中提供的数据,这个数据量有点大,运行要好长时间,这里的示例数据我们不用论文中的数据了,用自己随便构造的

最基本的进化树可视化

library(ggtree)
library(treeio)


tree <- read.tree("data/20220829/fig2.nwk")
ggtree(tree)+
  geom_tiplab()

image.png

准备表示分组的数据,这里需要用到一个列表格式的数据

groupInfo<-list(group1=c("A","B","C","D","E"),
                group2=c("F","G","H","I","J","K","L","M"))

然后使用groupOTU()函数将分组信息和进化树组合到一起

tree01<-groupOTU(tree,groupInfo)

对结果进行展示

ggtree(tree01,aes(color=group))+
  geom_tiplab(show.legend=F,offset = 1)+
  geom_tippoint(aes(shape=group),
                show.legend = F,
                size=5)

image.png

这里 color=group的group是默认生成的,不用改

更改配色

ggtree(tree01,aes(color=group),size=2)+
  geom_tiplab(show.legend=F,offset = 1)+
  geom_tippoint(aes(shape=group),
                show.legend = F,
                size=5)+
  scale_color_manual(values = c("#fb8d63","#69c0a2"))

image.png

封面图

ggtree(tree01,
       aes(color=group),
       size=2,
       layout = "circular",
       branch.length = "none")+
  geom_tiplab(show.legend=F,offset = 1)+
  geom_tippoint(aes(shape=group),
                show.legend = F,
                size=5)+
  scale_color_manual(values = c("#fb8d63","#69c0a2")) -> p1

p1
ggtree(tree01,aes(color=group),size=2)+
  geom_tiplab(show.legend=F,offset = 1)+
  geom_tippoint(aes(shape=group),
                show.legend = F,
                size=5)+
  scale_color_manual(values = c("#fb8d63","#69c0a2")) -> p2
p2
library(patchwork)

p1+theme(legend.position = "none")+
  p2+theme(legend.position = "none")

image.png

示例数据和代码可以给推文点赞 点击在看 最后留言获取

欢迎大家关注我的公众号

小明的数据分析笔记本

小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!
相关文章
|
6月前
|
机器学习/深度学习 数据可视化 算法
R语言神经网络与决策树的银行顾客信用评估模型对比可视化研究
R语言神经网络与决策树的银行顾客信用评估模型对比可视化研究
|
6月前
|
机器学习/深度学习 算法 数据库
数据分享|R语言用核Fisher判别方法、支持向量机、决策树与随机森林研究客户流失情况
数据分享|R语言用核Fisher判别方法、支持向量机、决策树与随机森林研究客户流失情况
|
6月前
|
机器学习/深度学习 数据采集 数据可视化
R语言SVM、决策树与因子分析对城市空气质量分类与影响因素可视化研究
R语言SVM、决策树与因子分析对城市空气质量分类与影响因素可视化研究
|
6月前
|
机器学习/深度学习 数据采集 算法
R语言、WEKA关联规则、决策树、聚类、回归分析工业企业创新情况影响因素数据
R语言、WEKA关联规则、决策树、聚类、回归分析工业企业创新情况影响因素数据
|
6月前
|
机器学习/深度学习 算法 搜索推荐
【视频】决策树模型原理和R语言预测心脏病实例|数据分享(上)
【视频】决策树模型原理和R语言预测心脏病实例|数据分享
|
6月前
|
机器学习/深度学习 数据采集 数据可视化
R语言航班延误影响预测分析:lasso、决策树、朴素贝叶斯、QDA、LDA、缺失值处理、k折交叉验证(上)
R语言航班延误影响预测分析:lasso、决策树、朴素贝叶斯、QDA、LDA、缺失值处理、k折交叉验证
|
6月前
|
机器学习/深度学习 数据可视化 算法
R语言CART决策树、随机森林、chaid树预测母婴电商平台用户寿命、流失可视化
R语言CART决策树、随机森林、chaid树预测母婴电商平台用户寿命、流失可视化
|
6月前
|
算法 数据挖掘 数据库
R语言主成分PCA、决策树、boost预警模型在跨区域犯罪研究数据挖掘分析|数据分享
R语言主成分PCA、决策树、boost预警模型在跨区域犯罪研究数据挖掘分析|数据分享
|
6月前
|
数据可视化 数据挖掘 数据处理
R语言用决策树的酒店收入和产量预测可视化研究
R语言用决策树的酒店收入和产量预测可视化研究
|
6月前
|
机器学习/深度学习 数据可视化 数据挖掘
R语言软件对房屋价格预测:回归、LASSO、决策树、随机森林、GBM、神经网络和SVM可视化|数据分享
R语言软件对房屋价格预测:回归、LASSO、决策树、随机森林、GBM、神经网络和SVM可视化|数据分享