三维基因组: Hi-C 差异分析(1)

简介: 三维基因组: Hi-C 差异分析(1)

摘要

细胞核中染色质的三维结构布局,让基因组能够实现动态调控以及根据细胞类型进行特异性转录。这种特性在不同层次上都有体现:从宏观角度看,染色体各自占据着特定的空间区域(染色体区域);在单个染色质纤维层面,它们被划分成不同的功能区域(比如拓扑关联域,TADs);还有在基因组的功能元件之间,存在着短距离的染色质相互作用(例如增强子与启动子之间的环状结构)。

基于染色体构象捕获(3 C)技术的高通量方法被广泛应用,极大地推动了我们对染色质在细胞核内组织方式的了解。尤其是 Hi-C 技术,它有望对染色质的三维相互作用进行全面的分析,因为它理论上可以检测到任何一对因靠近而连接在一起的限制性片段。

本文将介绍如何从预先计算好的 Hi-C 接触矩阵出发,在不同实验条件下对比染色质互作组的情况,如何将结果可视化,以及如何将染色质相互作用强度的变化与基因表达水平的改变联系起来。

简介

基因组的拓扑结构是表观遗传调控的最高层次,它是由基因组内部多层调控因素共同作用的结果。架构蛋白、转录因子(TFs)、转录机制的组成部分,以及组蛋白尾部的翻译后修饰和长非编码 RNA(lncRNAs)都在其中发挥协调作用。

一方面要获取基因组中储存的信息,另一方面又要保持染色质适度的压缩状态,这种矛盾导致了在 Hi-C 图谱上以拓扑关联域(TADs;)形式呈现的区域划分。当在低分辨率下观察时,这些结构在不同细胞类型中具有高度保守性。

在分辨率更高时,可以看到它们是由一些更小、更活跃的亚单位构成的,这些亚单位的形成主要受到组蛋白修饰组合以及染色质上蛋白质相互作用的影响,有时甚至会引发相分离。在 TADs 内部,基因组位点之间的相互作用强度会因细胞类型不同而有所差异,即便在同一种细胞中,也会因为外界刺激不同而改变,这样就能让调控元素更靠近它们的目标基因。所以,研究染色质结构在不同情况下的变化,是找出基因表达核心调控因素的关键。

染色质结构变化的影响越来越受到学术界的关注,相关研究覆盖了发育时的形状改变、细胞跨分化、重编程以及疾病状态等多个领域。与此同时,技术上的进步提高了数据分辨率,大大推动了人们对这类实验的兴趣。因此,当前一个迫切的任务是,把数据分析的基本原理传递给越来越多使用这项技术的人。

数据分析

Hi-C 数据分析包含一系列步骤,可以分成两大类:(1) 数据预处理,包括将数据比对到限制性片段上、剔除不需要的信息(比如相邻片段间的接触)或未被消化的片段对、分箱(也就是把相邻片段的读数对归纳到固定大小的基因组窗口里,这些窗口叫 bins)、生成接触矩阵,再通过归一化来修正技术和实验中产生的偏差;(2) 下游分析,涵盖的内容很广,从利用 Hi-C 数据辅助基因组组装,到分析染色质分区、识别 TADs 和染色质相互作用(比如启动子和增强子之间的接触),再到比较不同条件下的相互作用差异。目前大多数方法要么专注于预处理步骤,要么专门处理某些特定的下游分析。

本文主要讨论已发表的差异 Hi-C 数据分析方法,这些方法的目标是检测单个染色质接触的相互作用强度变化。因此,会简单概述 Hi-C 数据的预处理步骤,然后把重点放在分析预先计算好的 Hi-C 矩阵上。

Juicer 是一款命令行工具,功能上与 HiC-Pro 一致,但它采用了 BWA作为对齐方法,因此更适合处理读长较长(比如超过 75 bp)的数据集,这些数据更容易出现嵌合情况。它的输出是 .hic 文件,这种文件是高度压缩的二进制格式,可以保存不同分辨率的数据分段,访问起来很方便,还支持多种数据标准化方式。

未完待续,详细分析教程下期见!

相关文章
|
编解码 监控 算法
3D-Genome | Hi-C互作矩阵归一化指南
3D-Genome | Hi-C互作矩阵归一化指南
|
编解码 数据可视化 Java
三维基因组: TAD差异分析-HiCCUPS (2)
三维基因组: TAD差异分析-HiCCUPS (2)
1138 17
三维基因组: TAD差异分析-HiCCUPS (2)
|
7月前
|
人工智能 自然语言处理 搜索推荐
2025智能营销产品深度评测,国内主流智能营销厂商推荐
在数字化运营深化的时代,用户资产成为企业核心竞争力。用户智能运营产品已从单一营销工具演变为支撑用户生命周期管理、降本增效、业务增长的关键基础设施。面对AI自动化、全渠道数据整合、私域公域协同等趋势,企业需构建涵盖场景适配性、数据能力、智能化、生态集成等维度的选型体系。本文对比瓴羊Quick Audience、神策数据、致趣百川、Convertlab、HubSpot、Adobe Experience Cloud六大主流产品,揭示其在数据整合、运营自动化、个性化能力等方面差异,为企业提供科学选型参考,助力实现精细化运营转型。
|
10月前
|
存储 缓存 NoSQL
使用双 Bitmap实现签到和补签
在高并发场景下,采用双 Bitmap 实现签到与补签方案,具有内存占用低、操作效率高、并发安全等优势。通过 Redis 存储 Bitmap 数据,结合位运算实现签到记录与统计,可高效支撑大规模用户签到需求,适用于社交 APP、会员系统等场景。
|
机器学习/深度学习 监控 算法
《OpenCV实战指南:计算机视觉开发的高效路径》
计算机视觉技术正深刻改变生活,从美颜相机到自动驾驶,OpenCV作为该领域的“瑞士军刀”,为开发者提供强大支持。本文将介绍如何利用OpenCV进行图像处理、对象检测及视频分析等任务。从安装配置到基础操作(如图像读取与显示),再到高级功能(如滤波、几何变换、关键点检测与特征匹配),以及经典Haar级联分类器和基于深度学习的YOLO算法等对象检测方法,最后探索视频处理与分析能力。OpenCV几乎覆盖了计算机视觉的所有方面,帮助开发者实现从简单应用到复杂系统的创新,让计算机“看”懂世界,创造无限可能。
429 6
|
图形学
Unity时间转换方式
**时间戳与 DateTime 的转换简介** 时间戳是从1970年1月1日00:00:00起的秒数,可转为 DateTime 对象。DateTime 转时间戳则是计算与1970年1月1日的时间差。秒数与时分秒格式互转基于60进制换算规则。Unity 中可通过 Time 类处理游戏时间,并与其他时间格式进行换算,需考虑时区等差异。示例代码展示了 Unity 中计时器的实现及总用时转换成时分秒的两种方法。
960 10
|
数据可视化 Python
基因组之全局互作热图可视化
基因组之全局互作热图可视化
基因组之全局互作热图可视化
|
XML 开发框架 前端开发
利用代码生成工具Database2Sharp生成ABP VNext框架项目代码
利用代码生成工具Database2Sharp生成ABP VNext框架项目代码
|
监控 Java API
听我的,日志还是得好好打!
听我的,日志还是得好好打!
|
Rust 监控 JavaScript
抖音技术分享:飞鸽IM桌面端基于Rust语言进行重构的技术选型和实践总结
本文将介绍飞鸽IM前端团队如何结合Rust对飞鸽客户端接待能力进行的技术提升,一步步从概念验证、路径分解到分工开发,再到最后上线收益论证,并分享了其中遇到的技术挑战与经验总结等。
591 1