分级KEGG富集pathway图绘制

简介: 最近在基迪奥平台上看到了这张KEGG富集信息图,刚好手头有批现成的转录组数据,刚好绘制一下给富集图换换风格~~


最近在基迪奥平台上看到了这张KEGG富集信息图,刚好手头有批现成的转录组数据,刚好绘制一下给富集图换换风格~~

060fa47d988f359c2d572ad259bccf8.png

准备输入文件

平台上的输入文件是直接可以用来出图,这里前期我们需要对结果调整一下~输入文件就只需要富集到的pathway及对应的Count信息,再根据KEGG对应关系将前俩层级的信息merge到一起即可。这里方法有挺多,可以自己写script解析KEGG的pathway层级关系,也有一些R包或者在线网址可获取,动手google。这里我只取每个Pathway1类别中p值从小到大排名前5的作为演示。

dfb83b6d5630a5bda6347dd9a83c5df.png

## 加载所需R包
sapply(c('ggplot2','RColorBrewer','tidyverse'), require, character.only = TRUE)
## 读取KEGG富集结果文件
## 取pvalue前5的pathway
kegg_bar <- read.delim('../Data/test_keggBar.txt') %>% group_by(Pathway1) %>% 
  top_n(n = -5,wt = pvalue) ## 按照pvalue排名前5的pathway
## 取因子排名顺序,后面用到
ft <- unique(kegg_bar$Pathway1)

增添表中信息

## pathway3列中增添pathway的信息,并设置Count为0
kegg_bar %>% distinct(Pathway1,.keep_all = T) %>% mutate(Pathway3 = Pathway1,Count = 0) -> a
## 合并为一起,按照Pathway和Count进行排序,并选取所需列
kegg_bar <- rbind(kegg_bar,a) %>% arrange(Pathway1,Count) %>%
   select(Pathway1,Pathway3,Count,pvalue)
##添加一列Label,Count为0 的 标记为空
kegg_bar$Label <- ifelse(kegg_bar$Count == 0," ",kegg_bar$Count)
# 按照之前预设的因子排序
kegg_bar$Pathway1 <- factor(kegg_bar$Pathway1,levels = ft)
kegg_bar <- kegg_bar[order(kegg_bar$Pathway1),]
## 设置因子水平
kegg_bar$Pathway3 <- kegg_bar$Pathway3 %>% factor() %>% fct_inorder() %>% fct_rev()

整理好的表格如下:

Pathway3中第一行为Pathway1大类,数值为0,Label为空。


2ce5bcce1783da2574441cea9e4c5ac.png

作图

p1 <- ggplot(kegg_bar,aes(x = Count,Pathway3,fill = Pathway1))+
  geom_col()+ 
  geom_text(aes(label =Label),size = 2.5,hjust = "left",nudge_x = 0.1)+ ## 添加标签
  scale_x_continuous(limits = c(0,20.5),expand = expansion(mult = c(0,.1)))+ # 避免文字溢出
  labs(x = "Number of Gene",y = "",title = "KEGG pathway anotation")+
  scale_fill_brewer(palette = 'Set1') 
p1

4442498ac40c324d06c92fb83ee74fc.png

主题设置

首先获取其中配色信息,将图中的大类改为黑色,然后设置常规的主题信息即可。

## 复制
p2 <- p1
## 获取配色
g <- ggplot_build(p2)
mycol <- g$data[[1]]["fill"]
col <- rev(mycol$fill)
## 将Aclass对应的颜色改为黑色
num <- rev(kegg_bar$Count)
index <- which(num == 0)
col[index] <- "grey10"
## 自定义主题
my_theme <-  theme_bw()+theme(plot.title = element_text(size = rel(1),hjust = 0.2,face = 'bold'),
                   axis.title = element_text(size = rel(1)),
                   axis.text.y = element_text(size = rel(0.85),
                                              colour = col,face = 'bold'),
                   legend.position = "none",
                   plot.margin = unit(x = c(top.mar = 0.2,
                                            right.mar = 0.2,
                                            left.mar=0.2,
                                            bottom.mar= 0.2),units = 'inches'))
plot <- p2+my_theme1 
plot
ggsave('./KEGG_bar.pdf', plot, width = 8, height = 10)

f02643afda53a8acb46b4d79424c908.png



相关文章
|
人工智能 数据挖掘
这图怎么画| 气泡热图(基因表达泛癌分析)
这图怎么画| 气泡热图(基因表达泛癌分析)
156 0
|
机器学习/深度学习
这图怎么画| 相关性热图+柱状图
这图怎么画| 相关性热图+柱状图
128 0
|
人工智能 数据可视化 Go
R绘图实战|GSEA富集分析图
GSEA(Gene Set EnrichmentAnalysis),即基因集富集分析,它的基本思想是使用预定义的基因,将基因按照在两类样本中的差异表达程度排序,然后检验预先设定的基因集合是否在这个排序表的顶端或者底端富集。
2711 0
R绘图实战|GSEA富集分析图
|
1天前
|
数据可视化 Python
基因组之全局互作热图可视化
基因组之全局互作热图可视化
15 1
基因组之全局互作热图可视化
|
6月前
|
存储 数据可视化 数据挖掘
R语言绘制圈图、环形热图可视化基因组实战:展示基因数据比较
R语言绘制圈图、环形热图可视化基因组实战:展示基因数据比较
|
6月前
|
数据可视化
实现绘制Sankey桑基图(河流图、分流图)流程数据可视化
实现绘制Sankey桑基图(河流图、分流图)流程数据可视化
|
6月前
|
存储 数据可视化 关系型数据库
绘制圆环图/雷达图/星形图/极坐标图/径向图POLAR CHART可视化分析汽车性能数据
绘制圆环图/雷达图/星形图/极坐标图/径向图POLAR CHART可视化分析汽车性能数据
|
6月前
R语言中绘制箱形图的替代品:蜂群图和小提琴图
R语言中绘制箱形图的替代品:蜂群图和小提琴图
|
数据可视化
RNAseq|构建预后模型后你还需要这些图,森林图,诺莫图,校准曲线,DCA决策曲线
RNAseq|构建预后模型后你还需要这些图,森林图,诺莫图,校准曲线,DCA决策曲线
361 0
|
数据挖掘
这图怎么画| 批量小提琴图+箱线图+散点+差异分析
这图怎么画| 批量小提琴图+箱线图+散点+差异分析
304 0