SCENIC 识别转录因子调控网络原理分享

简介: 本分分享了关于学习参考多篇 介绍SCENIC 软件分析原理的博客和文献后总结的个人关于 SCENIC 识别转录因子调控网络原理的理解,以供参考学习

生物体必须要有精确的调控网络才能发挥其作用,序列特异性 TF 通过结合在顺式作用元件 (cis-regulatory element,CRE)上的特异性位点 (motif) 来调节靶标基因的转录,进而影响生物表型和适应度景观,同时还要跟其它很多因子交互,包括其它的转录因子、共同因子等。例如 40% 的肿瘤变异基因通过影响TF影响发病机制,一些著名的肿瘤基因如MYC, E2F, 和NF-κB都是转录因子。

人类基因组包含了 1800个 序列特异性的TF,每一个TF可以调节数百个靶标基因。某个TF和它所调控的所有靶标基因称为一个调节子( Regulon )。

SCENIC 的转录因子分析

SCENIC 的转录因子分析内容主要可分为两部分,建立 RegulonRegulon活性分析

生成由转录因子主导的基因调控网络(gene regulation network,GRNs) $\rightarrow$ 过滤网络内的假阳性靶点 $\rightarrow$ Regulon活性分析

1、共表达识别TF基因调控网络(GENIE3)

SCENIE 基于GRNBoost(由于R语言中好像没有GRNBoost算法框架,所以R版本的SCENIC使用了随机森林分类器,本质都是集成决策树模型),以 TF转录因子在样本的表达建立分类模型,从而搜索与 TF基因 协同变化的基因来确定潜在靶标基因(转录因子的潜在共表达网络)。每个网络包含一个转录因子及其系列潜在靶基因,纯粹基于共表达分析。…. 这也是SCENIC与WGCNA生成共表达网络时的差异(前者是分类,后者是聚类)。

GENIE 推断共表达这一步,可以事先通过降采样抽取少量细胞来推断 GRNs,后面在Regulon活性分析时纳入全组织细胞。

2、 构建Regulon (RcisTarget )

GENIE3 只是基于基因与TF的共表达推断建立了一个粗糙的调控网络,因此每个GRNs里面肯定存在假阳性的靶基因(即虽然是同该网络下的TF具有共表达趋势,但其实并不是受到了该TF调控的结果),对应构建一个尽量可靠的TF调控网络,这些靶点是有必要被过滤掉的。RcisTarget 基序富集分析方法基于 ENCODE 项目组的 motif数据库 ,该数据库记录了每个基因上游序列与 motif 的结合能,从而能够为每个TF-GRNs 执行 motif 富集分析,以过滤掉每个网络内缺乏 当前TF的直接motif支持 的假阳性靶标得到每个TF和其更可靠的靶标基因组成,称为 Regulon

2.1 RcisTarget 框架下的 Motif 富集原理



2.2 RcisTarget 纯化靶标基因策略

  • 对于一个 TF1 的所有潜在靶标基因集(s),执行 RcisTarget 富集 motifs ;
  • 对这些TF1靶标基因集合富集的 motifs 参考注释表,过滤出是TF1直接结合的 motifs ;
  • 使用 GSEA 的排列富集策略,保留每个 motif 中对富集得分贡献最大的基因成员与TF1 组成最终的Regulon。

参考官网该步骤的解释 createRegulons

3、 Regulon 活性评分-AUCell

AUCell 分析内容是对每个 Regulon 在各个细胞的活性进行评分。参考 GSVA 算法基于基因表达水平的排列策略。
我个人理解这个AUC应该是和motif富集的AUC是同个概念的,即计算了每个细胞里排列前5%的基因里 Regulon的召回率。
AUCell:计算单细胞转录组的每个细胞中特定基因集的活性程度

---


原理类:
iRegulon:从基因列表到调控网络
用iRegulon进行主转录因子的预测
RcisTarget包基因集的转录因子富集分析
单细胞SCENIC分析原理和流程
GSA、GSEA、ssGSEA、GSVA的算法原理及它们的联系与区别
经验累积分布函数

教程类:
官方SCENIC (aertslab.org)
SCENIC软件配套数据库_database
SCENIC单细胞转录因子分析
【单细胞测序21】scenic转录因子应用全解析和代码讲解-欧易生物_哔哩哔哩_bilibili

目录
相关文章
|
4天前
|
并行计算 安全 网络协议
探索未来网络:量子互联网的原理与应用
本文深入探讨了量子互联网的基本概念、技术原理及其潜在应用。通过对量子纠缠、量子叠加和量子隐形传态等核心概念的解释,文章展示了量子互联网如何利用量子力学特性来实现超高速、超高安全性的通信。此外,还讨论了量子互联网在金融、医疗、国防等领域的应用前景,以及当前面临的技术挑战和未来的发展方向。
|
25天前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习的奥秘:探索神经网络的核心原理
本文将深入浅出地介绍深度学习的基本概念,包括神经网络的结构、工作原理以及训练过程。我们将从最初的感知机模型出发,逐步深入到现代复杂的深度网络架构,并探讨如何通过反向传播算法优化网络权重。文章旨在为初学者提供一个清晰的深度学习入门指南,同时为有经验的研究者回顾和巩固基础知识。
43 11
|
2月前
|
机器学习/深度学习 存储 算法
回声状态网络(Echo State Networks,ESN)详细原理讲解及Python代码实现
本文详细介绍了回声状态网络(Echo State Networks, ESN)的基本概念、优点、缺点、储层计算范式,并提供了ESN的Python代码实现,包括不考虑和考虑超参数的两种ESN实现方式,以及使用ESN进行时间序列预测的示例。
78 4
回声状态网络(Echo State Networks,ESN)详细原理讲解及Python代码实现
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习中的自适应神经网络:原理与应用
【8月更文挑战第14天】在深度学习领域,自适应神经网络作为一种新兴技术,正逐渐改变我们处理数据和解决问题的方式。这种网络通过动态调整其结构和参数来适应输入数据的分布和特征,从而在无需人工干预的情况下实现最优性能。本文将深入探讨自适应神经网络的工作原理、关键技术及其在多个领域的实际应用,旨在为读者提供一个全面的视角,理解这一技术如何推动深度学习向更高效、更智能的方向发展。
|
3天前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习的奥秘:探索神经网络背后的原理与实践
【9月更文挑战第29天】本文将带你深入理解深度学习的核心概念,从基础理论到实际应用,逐步揭示其神秘面纱。我们将探讨神经网络的工作原理,并通过实际代码示例,展示如何构建和训练一个简单的深度学习模型。无论你是初学者还是有一定经验的开发者,这篇文章都将为你提供宝贵的知识和技能。
11 2
|
23天前
|
机器学习/深度学习 人工智能 自然语言处理
深度剖析深度神经网络(DNN):原理、实现与应用
本文详细介绍了深度神经网络(DNN)的基本原理、核心算法及其具体操作步骤。DNN作为一种重要的人工智能工具,通过多层次的特征学习和权重调节,实现了复杂任务的高效解决。文章通过理论讲解与代码演示相结合的方式,帮助读者理解DNN的工作机制及实际应用。
|
20天前
|
网络协议 Linux 应用服务中间件
Socket通信之网络协议基本原理
【9月更文挑战第14天】网络协议是机器间交流的约定格式,确保信息准确传达。主要模型有OSI七层与TCP/IP模型,通过分层简化复杂网络环境。IP地址全局定位设备,MAC地址则在本地网络中定位。网络分层后,数据包层层封装,经由不同层次协议处理,最终通过Socket系统调用在应用层解析和响应。
|
21天前
|
网络协议 网络架构 数据格式
TCP/IP基础:工作原理、协议栈与网络层
TCP/IP(传输控制协议/互联网协议)是互联网通信的基础协议,支持数据传输和网络连接。本文详细阐述了其工作原理、协议栈构成及网络层功能。TCP/IP采用客户端/服务器模型,通过四个层次——应用层、传输层、网络层和数据链路层,确保数据可靠传输。网络层负责IP寻址、路由选择、分片重组及数据包传输,是TCP/IP的核心部分。理解TCP/IP有助于深入掌握互联网底层机制。
100 2
|
2月前
|
缓存 网络协议 算法
网络编程原理
网络编程原理
|
2月前
|
网络协议 算法 安全
网络原理问题
网络原理问题
下一篇
无影云桌面