SCENIC 识别转录因子调控网络原理分享

简介: 本分分享了关于学习参考多篇 介绍SCENIC 软件分析原理的博客和文献后总结的个人关于 SCENIC 识别转录因子调控网络原理的理解,以供参考学习

生物体必须要有精确的调控网络才能发挥其作用,序列特异性 TF 通过结合在顺式作用元件 (cis-regulatory element,CRE)上的特异性位点 (motif) 来调节靶标基因的转录,进而影响生物表型和适应度景观,同时还要跟其它很多因子交互,包括其它的转录因子、共同因子等。例如 40% 的肿瘤变异基因通过影响TF影响发病机制,一些著名的肿瘤基因如MYC, E2F, 和NF-κB都是转录因子。

人类基因组包含了 1800个 序列特异性的TF,每一个TF可以调节数百个靶标基因。某个TF和它所调控的所有靶标基因称为一个调节子( Regulon )。

SCENIC 的转录因子分析

SCENIC 的转录因子分析内容主要可分为两部分,建立 RegulonRegulon活性分析

生成由转录因子主导的基因调控网络(gene regulation network,GRNs) $\rightarrow$ 过滤网络内的假阳性靶点 $\rightarrow$ Regulon活性分析

1、共表达识别TF基因调控网络(GENIE3)

SCENIE 基于GRNBoost(由于R语言中好像没有GRNBoost算法框架,所以R版本的SCENIC使用了随机森林分类器,本质都是集成决策树模型),以 TF转录因子在样本的表达建立分类模型,从而搜索与 TF基因 协同变化的基因来确定潜在靶标基因(转录因子的潜在共表达网络)。每个网络包含一个转录因子及其系列潜在靶基因,纯粹基于共表达分析。…. 这也是SCENIC与WGCNA生成共表达网络时的差异(前者是分类,后者是聚类)。

GENIE 推断共表达这一步,可以事先通过降采样抽取少量细胞来推断 GRNs,后面在Regulon活性分析时纳入全组织细胞。

2、 构建Regulon (RcisTarget )

GENIE3 只是基于基因与TF的共表达推断建立了一个粗糙的调控网络,因此每个GRNs里面肯定存在假阳性的靶基因(即虽然是同该网络下的TF具有共表达趋势,但其实并不是受到了该TF调控的结果),对应构建一个尽量可靠的TF调控网络,这些靶点是有必要被过滤掉的。RcisTarget 基序富集分析方法基于 ENCODE 项目组的 motif数据库 ,该数据库记录了每个基因上游序列与 motif 的结合能,从而能够为每个TF-GRNs 执行 motif 富集分析,以过滤掉每个网络内缺乏 当前TF的直接motif支持 的假阳性靶标得到每个TF和其更可靠的靶标基因组成,称为 Regulon

2.1 RcisTarget 框架下的 Motif 富集原理



2.2 RcisTarget 纯化靶标基因策略

  • 对于一个 TF1 的所有潜在靶标基因集(s),执行 RcisTarget 富集 motifs ;
  • 对这些TF1靶标基因集合富集的 motifs 参考注释表,过滤出是TF1直接结合的 motifs ;
  • 使用 GSEA 的排列富集策略,保留每个 motif 中对富集得分贡献最大的基因成员与TF1 组成最终的Regulon。

参考官网该步骤的解释 createRegulons

3、 Regulon 活性评分-AUCell

AUCell 分析内容是对每个 Regulon 在各个细胞的活性进行评分。参考 GSVA 算法基于基因表达水平的排列策略。
我个人理解这个AUC应该是和motif富集的AUC是同个概念的,即计算了每个细胞里排列前5%的基因里 Regulon的召回率。
AUCell:计算单细胞转录组的每个细胞中特定基因集的活性程度

---


原理类:
iRegulon:从基因列表到调控网络
用iRegulon进行主转录因子的预测
RcisTarget包基因集的转录因子富集分析
单细胞SCENIC分析原理和流程
GSA、GSEA、ssGSEA、GSVA的算法原理及它们的联系与区别
经验累积分布函数

教程类:
官方SCENIC (aertslab.org)
SCENIC软件配套数据库_database
SCENIC单细胞转录因子分析
【单细胞测序21】scenic转录因子应用全解析和代码讲解-欧易生物_哔哩哔哩_bilibili

目录
相关文章
|
5月前
|
机器学习/深度学习 PyTorch TensorFlow
卷积神经网络深度解析:从基础原理到实战应用的完整指南
蒋星熠Jaxonic,深度学习探索者。深耕TensorFlow与PyTorch,分享框架对比、性能优化与实战经验,助力技术进阶。
|
11月前
|
机器学习/深度学习 存储 算法
NoProp:无需反向传播,基于去噪原理的非全局梯度传播神经网络训练,可大幅降低内存消耗
反向传播算法虽是深度学习基石,但面临内存消耗大和并行扩展受限的问题。近期,牛津大学等机构提出NoProp方法,通过扩散模型概念,将训练重塑为分层去噪任务,无需全局前向或反向传播。NoProp包含三种变体(DT、CT、FM),具备低内存占用与高效训练优势,在CIFAR-10等数据集上达到与传统方法相当的性能。其层间解耦特性支持分布式并行训练,为无梯度深度学习提供了新方向。
620 1
NoProp:无需反向传播,基于去噪原理的非全局梯度传播神经网络训练,可大幅降低内存消耗
|
5月前
|
监控 负载均衡 安全
WebSocket网络编程深度实践:从协议原理到生产级应用
蒋星熠Jaxonic,技术宇宙中的星际旅人,以代码为舟、算法为帆,探索实时通信的无限可能。本文深入解析WebSocket协议原理、工程实践与架构设计,涵盖握手机制、心跳保活、集群部署、安全防护等核心内容,结合代码示例与架构图,助你构建稳定高效的实时应用,在二进制星河中谱写极客诗篇。
WebSocket网络编程深度实践:从协议原理到生产级应用
|
6月前
|
机器学习/深度学习 人工智能 算法
卷积神经网络深度解析:从基础原理到实战应用的完整指南
蒋星熠Jaxonic带你深入卷积神经网络(CNN)核心技术,从生物启发到数学原理,详解ResNet、注意力机制与模型优化,探索视觉智能的演进之路。
608 11
|
6月前
|
机器学习/深度学习 算法 搜索推荐
从零开始构建图注意力网络:GAT算法原理与数值实现详解
本文详细解析了图注意力网络(GAT)的算法原理和实现过程。GAT通过引入注意力机制解决了图卷积网络(GCN)中所有邻居节点贡献相等的局限性,让模型能够自动学习不同邻居的重要性权重。
1214 0
从零开始构建图注意力网络:GAT算法原理与数值实现详解
|
6月前
|
安全 测试技术 虚拟化
VMware-三种网络模式原理
本文介绍了虚拟机三种常见网络模式(桥接模式、NAT模式、仅主机模式)的工作原理与适用场景。桥接模式让虚拟机如同独立设备接入局域网;NAT模式共享主机IP,适合大多数WiFi环境;仅主机模式则构建封闭的内部网络,适用于测试环境。内容简明易懂,便于理解不同模式的优缺点与应用场景。
949 0
|
8月前
|
机器学习/深度学习 人工智能 PyTorch
零基础入门CNN:聚AI卷积神经网络核心原理与工业级实战指南
卷积神经网络(CNN)通过局部感知和权值共享两大特性,成为计算机视觉的核心技术。本文详解CNN的卷积操作、架构设计、超参数调优及感受野计算,结合代码示例展示其在图像分类、目标检测等领域的应用价值。
484 7
|
10月前
|
监控 应用服务中间件 Linux
掌握并发模型:深度揭露网络IO复用并发模型的原理。
总结,网络 I/O 复用并发模型通过实现非阻塞 I/O、引入 I/O 复用技术如 select、poll 和 epoll,以及采用 Reactor 模式等技巧,为多任务并发提供了有效的解决方案。这样的模型有效提高了系统资源利用率,以及保证了并发任务的高效执行。在现实中,这种模型在许多网络应用程序和分布式系统中都取得了很好的应用成果。
287 35
|
10月前
|
机器学习/深度学习 算法 测试技术
图神经网络在信息检索重排序中的应用:原理、架构与Python代码解析
本文探讨了基于图的重排序方法在信息检索领域的应用与前景。传统两阶段检索架构中,初始检索速度快但结果可能含噪声,重排序阶段通过强大语言模型提升精度,但仍面临复杂需求挑战
344 0
图神经网络在信息检索重排序中的应用:原理、架构与Python代码解析
|
9月前
|
安全 Java 程序员
分析Muduo网络库源码中的TcpServer组件工作原理
简言之,TcpServer 在 Muduo 中的角色,就是一位终极交通指挥员,它利用现代计算机网络的魔法,确保数据如同车辆一般,在信息高速公路上自由、安全、高效地流动。
119 0

热门文章

最新文章