Sentieon数据质控QC模块介绍

简介: Sentieon数据质控QC模块介绍

Sentieon持续为业界提供高性能的NGS数据分析软件。在数据处理模块之外,Sentieon软件套装中还包含了多个用于BAM和VCF文件的质控模块相比于常规的GATK/Picard工具,Sentieon的质控工具利用Sentieon引擎对于BAM文件进行高速读取,可以大幅度提升分析速度,缩短全流程的耗时。


CoverageMetrics模块


下面我们以常用的BAM深度统计工具“CoverageMetrics”为例,做个具体介绍。CoverageMetrics工具匹配了GATK的“DepthOfCoverage”工具,以BAM文件为输入,可以统计出某个位置、某个区间、某个基因或者全局的测序深度数据,同时也可以将全局数据通过平均值、中位数、四分位或者超过某个深度阈值的比例等形式进行输出展示。


比如在统计全基因组数据质量时常用的“xx%区域的覆盖深度超过15x”这样的指标,就可以由这个质控模块给出。如下图所示,与开源软件对比,”CoverageMetrics”模块的提速在10-80倍之间。



除了统计深度,我们还提供了统计其他常用质控数据的模块,包括统计双端测序insert size的“InsertSizeMetricAlgo”模块;统计GC content的”GCBias”模块;统计比对质量的”AignmentStat”模块;统计panel捕获效率的”HsMetricAlgo”模块;统计测序质量的”QualDistribution”模块;以及统计VCF质控数据的”CollectVCMetrics”模块等。 


质控模块


我们目前Sentieon软件包中的QC质控模块,以及对应的开源工具列举如下:



建议Sentieon用户对照这张表格,将目前流程中的质控模块都尽可能替换成Sentieon工具,获得最大的分析速度与计算成本的收益。

软件试用:Sentieon基因数据分析加速软件 -官方试用下载 (insvast.com)

目录
相关文章
|
5月前
|
运维 安全
基于simulink的分布式发电系统自动重合闸的建模与仿真分析
本课题研究配电系统中分布式电源接入后的自动重合闸问题,着重分析非同期重合闸带来的冲击电流及其影响。通过Simulink搭建模型,仿真不同位置及容量的分布式电源对冲击电流的影响,并对比突发性和永久性故障情况。利用MATLAB2022a进行参数设置与仿真运行,结果显示非同期重合闸对系统安全构成挑战,需通过优化参数提升系统性能。
|
6月前
|
存储 算法 Shell
Sentieon | 应用教程:Sentieon分布模式
本文档描述了如何利用Sentieon®基因组学工具的分片能力将DNAseq®流程分布到多台服务器上;将其他流程(如TNseq®)进行分布遵循相同原则,因为所有Sentieon®基因组学工具都具有相同的内置分布式处理能力。这种分布的目标是为了减少流程的总运行时间,以更快地生成结果;然而,这种分布也会带来一些额外的开销,使计算成本增加。
81 2
|
8月前
|
存储 Shell 索引
单细胞分析(Signac): PBMC scATAC-seq 质控
单细胞分析(Signac): PBMC scATAC-seq 质控
73 0
|
8月前
|
存储 数据挖掘 BI
GT的使用及耗电量统计的原理,对GT采集的电池数据采用VBA分析
GT的使用及耗电量统计的原理,对GT采集的电池数据采用VBA分析
49 0
|
算法 搜索推荐 数据挖掘
Sentieon | 每周文献-Multi-omics(多组学)-第九期
Sentieon | 每周文献-Multi-omics(多组学)-第九期
74 0
Sentieon | 每周文献-Multi-omics(多组学)-第九期
|
存储 JSON Java
GATK4重测序数据怎么分析?
GATK4重测序数据怎么分析?
|
数据挖掘 数据中心
Hap-eval:Sentieon开源的多测序平台SV精度评估工具
Hap-eval:Sentieon开源的多测序平台SV精度评估工具
96 0
|
机器学习/深度学习 算法 数据挖掘
Sentieon | 应用教程: 使用DNAscope对HiFi长读长数据进行胚系变异检测分析
Sentieon | 应用教程: 使用DNAscope对HiFi长读长数据进行胚系变异检测分析
126 0
|
数据采集 算法
测序质控和基因组组装原理
测序质控和基因组组装原理
|
数据可视化 JavaScript 前端开发
植物泛基因组分析之可视化vg构建的Pan-SV初次尝试
植物泛基因组分析之可视化vg构建的Pan-SV初次尝试