基于GO-Figure快速绘制GO富集气泡图

简介: GO-Figure! 是一个基于pyhton写的GO富集小软件,方便我们拿到富集结果后直接使用命令行的形式进行可视化,绘制出具有灵活性、可重复性的图形,且可基于最新的GO数据库内容进行富集。效果图如下,若用惯了常见的气泡柱形图,这种形式也不失为一种新颖的可视化方法~

eb4293141892582810def055682690c.png

pip安装packages

首先要确保使用的python3以上

##安装软件
git clone https://gitlab.com/evogenlab/GO-Figure.git
##下载以下几个packages
pip install numpy 
pip install matplotlib
pip install seaborn
pip install scikit-learn 
pip install adjustText
##检测是否成功使用
 python3 gofigure.py -h

ae52abe1d1cdf8378eb705f1e9a1cdd.png

重要参数

-rs/--random_seed: 相当于随机种子,图形label有重叠时候可以替换,默认1

-i/-o: 输入、输出

-a,--max_clusters: 要绘制的最大term数量(整数值)。默认= 50。

-j: 输入文件的类型

-n, --ontology: 使用哪个本体:生物过程('bpo')、分子功能('mfo')、细胞成分('cco'),还是所有本体('all')。默认就是all。

-si, --similarity_cutoff:GO terms相似性阈值介于0到1之间. Default = 0.5.

-r, --representatives: 具有作为代表的优先级的GO terms。逗号分割,如 'GO:0000001,GO:0000002

-v, --max_pvalue: 最大的p value

-so, --sort_by: 基于哪列的值进行排序

nc, --name_changes: 更改名字

.......(还有挺多有用参数,自行了解)

输入数据类型

具有以下4种类型

1. Standard input

标准的输入数据只含有两列信息:GO term 和 富集的Pvalue

54b84d0c9ba493a6d5da8a3580d8767.png

2. Standard-plus input

我们也可以增添一列显著term中包含的gene数量

a406ccd418cbb00c46612e02845f5c7.png

3. TopGO input

使用TopGO富集结果,带上行号共有以下7列数据

a58bbe2300e06a2a33f1a28c11a2ddd.png

4. GOStats input

使用GOStats包的输出结果,包含以下7列信息,开头的几行信息可以删除。

34abb90e36971a14b63e5c7f56f1094.png

绘图

这里我们拿自带的standard-plus_example_input.tsv文件举例进行分析

基础图形

python3 gofigure.py -i example_data/standard-plus_example_input.tsv -j standard-plus -o result 
##

8c88c9a0e8261461347f5841ed2fcd5.png

这里可以通过-si 参数设置阈值 , -v 设置显著性阈值

python3 gofigure.py -i example_data/standard-plus_example_input.tsv -j standard-plus -si 0.8 -v 0.00001

ece3fbd88f053a94bd17b8e5eb9765b.png

改变色彩

python3 gofigure.py -i example_data/standard-plus_example_input.tsv -j standard-plus -p viridis -o result

82474bd07251bb21c7028a959384e89.png

添加标签及箭头

python3 gofigure.py -i example_data/standard-plus_example_input.tsv -j standard-plus -u go-arrows -o result

866e30177bbc0b75253979697c96f18.png

更多参数及使用例子详见文档Waterhouse Lab / GO-Figure · GitLab学习。

注:更新GO-Figure!

开头的地方提到了可基于最新的GO数据库内容进行富集,就是因为该软件进行分析基于的数据主要来自于以下两个文件:

  1. go.obo (http://geneontology.org/docs/download-ontology/)
  2. goa_uniprot_all.gaf.gz (https://ftp.ebi.ac.uk/pub/databases/GO/goa/UNIPROT/) 解压后100G~左右

这两个文件是持续更新的,因此我们使用前下载这两个最新的文件,就可以富集到更加可靠的结果。

下载完毕后,我们还需要使用软件自带的脚本对这两个文件进行解析:

python3 scripts/relations.py data/go.obo > data/relations.tsv
python3 scripts/ics.py data/relations.tab goa_uniprot_all.gaf data/go.obo > data/ic.tab

至此,拿到relations.tsv和ic.tab两个文件后,我们就可以使用上述的命令行进行富集分析了~自己体验下吧!

相关文章
|
6月前
|
数据可视化 数据挖掘 Go
GOplot|宝藏R包,拯救你的GO富集结果,杜绝平庸的条形图
`GOplot`是R中的一个宝藏包,用于GO富集分析的创新可视化。它提供多种图表类型,如GOBar、GOBubble、GOCircle、GOChord、GOHeat和GOCluster,以及GOVenn。通过调整参数,用户可自定义颜色、大小和排序。例如,GOBar和GOBubble展示富集条形和气泡,GOCircle以环形图表示,GOChord描绘基因和过程间关系,而GOHeat和GOCluster提供热图和聚类视图。此外,还有GOVenn用于绘制Venn图。包简化了数据准备和绘图过程,适合快速高效地展示复杂分析结果。别忘了引用创始人Walter等人的工作。
405 1
|
6月前
|
数据可视化 数据挖掘 Go
GOplot|宝藏R包,拯救你的GO富集结果,杜绝平庸的条形图
`GOplot`是一款R包,专注于GO富集分析的可视化,提供多种图表类型如GOBar、GOBubble、GOCircle、GOChord和GOVenn等。这些函数允许用户轻松修改参数,定制颜色、大小和排序,实现数据的直观展示。示例代码展示了如何使用这些功能创建不同类型的图形,并提到了一个配套的shiny应用。`GOplot`简化了复杂的数据可视化过程,适合快速高效地展示差异分析结果。
138 0
|
存储 Go
速绘丨GO富集气泡图绘制方法,利用R语言ggplot2包快速绘制,完整脚本可重复绘图
速绘丨GO富集气泡图绘制方法,利用R语言ggplot2包快速绘制,完整脚本可重复绘图
|
数据采集 数据可视化 大数据
渐进式学习:如何用R和GO富集可视化捕捉生命的关键信号?
本文还将提供一些使用R和GO富集可视化的基本方法和技巧,并以实例说明如何从生物大数据中捕捉关键信号。最后,我们将讨论GO富集可视化在生物信息学中的未来发展和可能的研究方向。
213 0
ggplot2|绘制GO富集柱形图
ggplot2|绘制GO富集柱形图
524 0
|
Go 数据库 Python
Bingo(Cytoscape插件)GO功能富集分析
转录组分析中基因的GO富集分析这步有很多软件可以选择,这次我们来介绍下如何利用Cytoscape软件中的一个简单又好用的Bingo小插件完成富集的工作,Cytoscape其实是一个做网络图的软件,所以使用Bingo的这种方法特别之处就在于富集的结果是可以直接以网络图的形式呈现,类似于下图这种效果,区别于其他的软件大多只生成表的形式。
605 0
|
存储 数据可视化 数据挖掘
跟着Nature Communications学作图:R语言ggplot2柱形图展示GO富集分析的结果
跟着Nature Communications学作图:R语言ggplot2柱形图展示GO富集分析的结果
|
6天前
|
安全 网络协议 Go
Go语言网络编程
【10月更文挑战第28天】Go语言网络编程
93 65
|
6天前
|
网络协议 安全 Go
Go语言进行网络编程可以通过**使用TCP/IP协议栈、并发模型、HTTP协议等**方式
【10月更文挑战第28天】Go语言进行网络编程可以通过**使用TCP/IP协议栈、并发模型、HTTP协议等**方式
27 13
|
2天前
|
测试技术 Go
go语言中测试工具
【10月更文挑战第22天】
9 4