Sentieon持续为业界提供高性能的NGS数据分析软件。在数据处理模块之外,Sentieon软件套装中还包含了多个用于BAM和VCF文件的质控模块。相比于常规的GATK/Picard工具,Sentieon的质控工具利用Sentieon引擎对于BAM文件进行高速读取,可以大幅度提升分析速度,缩短全流程的耗时。
CoverageMetrics模块
下面我们以常用的BAM深度统计工具“CoverageMetrics”为例,做个具体介绍。CoverageMetrics工具匹配了GATK的“DepthOfCoverage”工具,以BAM文件为输入,可以统计出某个位置、某个区间、某个基因或者全局的测序深度数据,同时也可以将全局数据通过平均值、中位数、四分位或者超过某个深度阈值的比例等形式进行输出展示。
比如在统计全基因组数据质量时常用的“xx%区域的覆盖深度超过15x”这样的指标,就可以由这个质控模块给出。如下图所示,与开源软件对比,”CoverageMetrics”模块的提速在10-80倍之间。
除了统计深度,我们还提供了统计其他常用质控数据的模块,包括统计双端测序insert size的“InsertSizeMetricAlgo”模块;统计GC content的”GCBias”模块;统计比对质量的”AignmentStat”模块;统计panel捕获效率的”HsMetricAlgo”模块;统计测序质量的”QualDistribution”模块;以及统计VCF质控数据的”CollectVCMetrics”模块等。
质控模块
我们目前Sentieon软件包中的QC质控模块,以及对应的开源工具列举如下:
建议Sentieon用户对照这张表格,将目前流程中的质控模块都尽可能替换成Sentieon工具,获得最大的分析速度与计算成本的收益。