ChIP-seq 分析:Peak 注释与可视化(9)

简介: 到目前为止,我们一直在处理对应于转录因子结合的 ChIPseq 峰。顾名思义,转录因子可以影响其靶基因的表达。

1. 基因注释

转录因子的目标很难单独从 ChIPseq 数据中确定,因此我们通常会通过一组简单的规则来注释基因的峰:

如果峰与基因重叠,则通常将峰注释为基因。

2. Peak 注释

ChIPseeker 是一个有用的基因峰注释包。通过在小鼠 TXDB 对象(mm10 基因组)的来源中使用预定义的注释,ChIPseeker 将为我们提供峰落在基因中的位置以及到 TSS 位点的距离的概览。

首先加载下一部分所需的库。

library(TxDb.Mmusculus.UCSC.mm10.knownGene)
library(org.Mm.eg.db)
library(GenomeInfoDb)
library(ChIPseeker)

annotatePeak 函数接受要注释的区域的 GRanges 对象、基因位置的 TXDB 对象和要从中检索基因名称的数据库对象名称。

peakAnno <- annotatePeak(macsPeaks_GR, tssRegion = c(-500, 500), TxDb = TxDb.Mmusculus.UCSC.mm10.knownGene,
    annoDb = "org.Mm.eg.db")

peakAnno &lt;- annotatePeak(macsPeaks_GR, tssRegion = c(-500, 500), TxDb = TxDb.Mmusculus.UCSC.mm10.knownGene,

class(peakAnno)

peakAnno

结果是一个包含峰注释和整体注释统计信息的 csAnno 对象。

peakAnno

peakAnno

csAnno 对象包含有关基因的单个峰的注释信息。要从 csAnno 对象中提取它,ChIPseeker 函数 as.GRanges 或 as.data.frame 可用于生成具有峰及其相关基因的相应对象。

peakAnno_GR <- as.GRanges(peakAnno)
peakAnno_DF <- as.data.frame(peakAnno)
peakAnno_GR[1:2, ]

peakAnno_GR

3. 可视化 Peak 注释

现在我们有了来自 ChIPseeker 的注释峰,我们可以使用 ChIPseeker 的一些绘图功能来显示基因特征中峰的分布。在这里,我们使用 plotAnnoBar 函数将其绘制为条形图,但 plotAnnoPie 会生成类似于饼图的图。

plotAnnoBar(peakAnno)

plotAnnoBar

同样,我们可以绘制 TSS 站点周围峰值的分布。

plotDistToTSS(peakAnno)

plotDistToTSS

ChIPseeker 还可以提供一个简洁的图来描述注释之间的重叠。

upsetplot(peakAnno, vennpie = F)

upsetplot

相关文章
|
C++
如何使用MACS进行peak calling
MACS2是peak calling最常用的工具。 callpeak用法 这是MACS2的主要功能,因为MACS2的目的就是找peak,其他功能都是可有可无,唯独callpeak不可取代。
4926 0
|
数据可视化 Go 数据库
ChIP-seq 分析:基因集富集(11)
转录因子或表观遗传标记可能作用于按共同生物学特征(共享生物学功能、RNAseq 实验中的共同调控等)分组的特定基因组。
|
机器学习/深度学习 Linux Shell
超详细的Linux-Conda环境安装教程
超详细的Linux-Conda环境安装教程
|
7月前
|
存储 数据挖掘 Serverless
HiChIP 数据分析: 差异 Loop 检测
HiChIP 数据分析: 差异 Loop 检测
HiChIP 数据分析: 差异 Loop 检测
|
7月前
|
C++ Windows
应用程序无法正常启动(0xc0000005)?C++报错0xC0000005如何解决?使命召唤17频频出现闪退,错误代码0xC0000005(0x0)
简介: 本文介绍了Windows应用程序出现错误代码0xc0000005的解决方法,该错误多由C++运行库配置不一致或内存访问越界引起。提供包括统一运行库配置、调试排查及安装Visual C++运行库等解决方案,并附有修复工具下载链接。
1945 1
如何用vcftools从VCF文件中提取某条染色体信息
如何用vcftools从VCF文件中提取某条染色体信息
element-ui表格数据样式及格式化
element-ui表格数据样式及格式化
378 2
|
数据挖掘 索引 算法
biostar handbook(八)|高通量数据分析初步:序列比对
高通量短读比对工具 在过去的十几年里,随着高通量测序(HTS)成本降低,出现了各种测序概念, DNA-Seq, ChIP-Seq, RNA-Seq, BS-Seq覆盖了研究领域的方方面面。
1921 0