摘要
HiChIP 是一种基于原位 Hi-C 的新型方法,用于分析染色质相互作用,它在流程中加入了一个免疫沉淀 (ChIP) 步骤,以研究由特定蛋白质驱动的染色质结构。该方法被证明非常高效,因为它能可靠地重现 Hi-C 结果,并且与其他基于 ChIP 的技术(如 ChIA-PET)相比,在所需输入细胞量更低的情况下,仍能提供更高比例的信息性读取。尽管 HiChIP 数据的预处理可以使用为其他 Hi-C 技术开发的相同方法完成,但染色质相互作用的识别需要考虑由 ChIP 步骤引入的特定偏差。
在本文中,我们描述了一种计算流程,用于分析在人类胚胎干细胞中,在热休克处理前后,通过 Rad21(黏连蛋白复合体的一部分)免疫沉淀获得的 HiChIP 数据。
我们将详细描述了原始数据的预处理、染色质相互作用的识别、处理所诱导改变的评估,以及最后差异 loop 的可视化。
简介
HiChIP 是一种近期发表的、以蛋白质为中心的染色质结构研究方案。它属于 3C 技术 的一种,并复现了经典的原位 Hi-C 流程,只是在 DNA 消化和连接之后额外增加了一个染色质免疫沉淀 (ChIP) 步骤,从而仅分离并测序与特定蛋白质交联的片段。这使得分析可以聚焦于与目标蛋白相关的位点,而非测量所有相互接触的片段。使用针对黏连蛋白亚基 Smc1a 的抗体进行的 HiChIP 已被证明能够可靠地与原位 Hi-C 结果重叠,并提高了信噪比。此外,与另一种基于 ChIP 的方案 ChIA-PET 相比,HiChIP 在整体信息性读取率上更高,且所需的输入细胞量更低。尽管具备方法学优势,免疫沉淀步骤的加入会导致测序读取在分布上不均匀,并偏向特定限制性片段,这一点必须在识别局部富集的相互作用(loops)时予以特别考虑。
内容讲解
在本章中,我们展示了一套用于分析 HiChIP 数据并识别和可视化 loops 的流程。来自公共 HiChIP 数据集(包含不同实验条件)的原始测序数据,首先使用 HiC-Pro进行处理,该流程对读段对进行比对和过滤。为识别局部富集的相互作用,过滤后的读段由 hichipper 进行分析,它是 Mango 算法的修改版本,可校正与 ChIP 步骤相关的测序偏差,并利用 ChIP-Seq 数据提高相互作用检测的准确性。我们进一步使用 diffloop对已识别的 loops 进行分析,以寻找样本之间拓扑结构的显著变化(即 loops 的获得与丢失)。最后,我们使用 diffloop 和 WashU Epigenome Browser对局部相互作用进行可视化,以探究不同条件下染色质相互作用的变化,并将其与表观基因组数据进行比较。