地址: http://wego.genomics.org.cn/
GO简介
所谓的基因本体论Gene Ontology(GO),是生物学功能注释的一个标准词汇表术语,目的就是将特定的基因产物(蛋白质、非编码RNA或大分子复合物,为简单起见,我们通常将其称为“基因”)与特定的本体术语关联起来的基于证据的陈述基因本体论定义了一系列与基因功能相关的概念(“GO terms”),以及这些功能之间是如何相互关联的(“关系”)。随着生物知识和数据库的不断更新,它不断地被修订和扩充。GO注释可以从三个方面描述功能:分子功能Molecular Function(由基因产物执行的分子水平活动)、细胞成分Cellular Component(基因产物执行功能的相对于细胞结构的位置)和生物过程Biological Process(由多个分子活动完成的较大过程或“生物程序”)。其实大多文献中生物过程的注释结果一般比较常用。
Wego使用
wego的使用很简单,该网站最常用的俩个图就是主页上显示的这俩个,使用前建议大家先去看下官网上的Documentation文档。点进去之后会有个快速指引的文档,大致介绍了WEGO输入,使用,输出,查询等。
首先看下WEGO的输入文件格式:
就是第一列基因ID,后面的对应的GO号,如果有多个GO号就以Tab分割,没有GO注释的基因就显示空白,我们在Input of WEGO部分会发现一个下载demo数据的链接here,我们先下载示例数据到本地上传WEGO中去演示一下,这里下载后会有俩个文件demo1和demo2。此时我们返回到主页上,直接将刚刚下载的文件拖到图中灰色框中,注意选择文件的格式与数据库的版本,然后点击Submit即可。
我们稍等一会,会看到网站出现以下结果,首先会看到Summary的一个总结表,统计了俩个文件基因的注释基因,分别注释到了生物进程,分子功能,细胞成分三个部分的基因数目和总的基因数目,往下看就是一个GO Tree,对应的是每层 的GO注释信息,可以选择Show Go Level选择注释等级,对于这块内容大家去看文档说明有一part是专门说GO Tree的。
最主要的内容当然是Graph图形部分了,我们点击之后,看到俩种形式的图,看到第一个图有没有很熟悉的感觉,没错这种图在生信公司的结题报告中经常出现,我们把demo1和demo2文件换成转录组分析中的差异基因上调和下调的注释文件,之后这图就可以表示为上下调基因在GO三个部分中的注释情况了。颜色及名字可以自定义,保存的话对应有svg,png,jepg三种格式,根据需要保存即可。
其他问题
- 注意一点,一般公司给的注释表中都会给这种形式的,复制到记事本里,把分隔符换成Tab分割,NA都替换为空值即可,这点大家应该都会的,总之是要确保和输入文件的格式一致,上传文件时候选择Native Format格式即可。
- 页面中还有个Tools的功能也挺常用的,如果想快速知道某GO号对应的功能,这个功能也是不错的选择。
引用文章(WEGO):
Ye J, Fang L, et al. Nucleic. Acids Res., 2006, 34(Web service issue), 293-297.
Ye J, Zhang Y, et al. Nucleic Acids Res. 2018 Jul 2;46(W1):W71-W75.