富集分析
基因功能富集分析,是指借助各类数据库和分析工具进行统计分析,挖掘在数据库中与我们要研究的生物学问题具有显著相关性的基因功能类别。它的统计原理是用超几何分布型来检验一组基因(共表达或差异表达)中某个功能类的显著性,通过离散分布的显著性分析、富集度分析和假阳性分析, 得出与实验目的有显著关联的、低假阳性率的及靶向性的基因功能类别。
Metascape数据库
Metascape将40多种生物信息学知识库整合到一个单一的用户界面中。数据库更新更快,效果更好。输出结果容易理解,图表质量较高。整合了GO、KEGG、UniProt和DrugBank等多个权威的数据资源,使其不仅能完成通路富集和生物过程注释,还能做基因相关的蛋白质网络分析和涉及到的药物分析。
绘制
1. 打开数据库
Metascape
http://metascape.org/gp/index.html#/main/step1
2. 输入文件格式
20210430_5
其他格式可点击示例数据查看:
20210430_6
3. 粘贴基因列表或者上传基因文件
20210430_2
点击Submit提交。
4.设置物种
20210430_7
5. 开始富集
可以直接点击Express Analysis。
默认的Express Analysis会把许多个数据库,如Reactome、KEGG、Hallmark和GO数据库全部一起展示。
点击custome Analysis进行设置。
我们以GO富集为例:
20210430_12
选好后,点击左上角enrichment analysis。
分析时,基因组中的所有基因都被用作富集背景基因。默认阈值为,p< 0.01、最小计数为3、富集因子> 1.5(富集因子是观察到的计数和偶然期望的计数之间的比率)的条目被收集,并根据它们的隶属关系相似性分组到集群中。
6. 结果
打开图片,可保存为PDF.
20210430_11
其他数据库,如KEGG,步骤类似。