基准与方法研究系列文章-1
- 标题(英文):Sentieon DNAscope LongRead – A highly Accurate, Fast, and Efficient Pipeline for Germline Variant Calling from PacBio HiFi reads
- 标题(中文):Sentieon DNAscope LongRead – 用于 PacBio HiFi 读取的种系变异识别的高度准确、快速且高效的管道
- 发表期刊:bioRxiv
- 作者单位:Sentieon和Pacbio
- 发表年份:2022
- 文章地址:
- https://doi.org/10.1101/2022.06.01.494452
PacBio ® HiFi测序是首个提供经济且高精度长读长测序的技术,平均读长大于10kb,平均碱基准确度达到99.8% 。在该研究中,研究者推出了 DNAscope LongRead,这是一种用于从 PacBio ® HiFi 读取中进行种系变异调用的准确而高效的管道。DNAscope LongRead 是 Sentieon DNAscope 工具的修改和扩展,DNAscope 工具是一款荣获 FDA 奖项的精确变异识别器。DNAscope LongRead 计算效率高,并且高度准确,在最新 GIAB 基准数据集上,HiFi 样本的精确度和召回率超过 99.83%,并且对基准数据集以及上游文库制备和测序的变化具有鲁棒性。
在本文中,研究者介绍了 DNAscope LongRead,这是一种高度准确、高效、稳健且可扩展的管道,用于从 PacBio HiFi 读取中进行种系变异调用。与 Precision FDA Truth Challenge V2 获胜变异检出管道相比,DNAscope LongRead 管道在所有基准区域中平均误差降低了 15%。
基准与方法研究系列文章-2
- 标题(英文):Processing UMI Datasets at High Accuracy and Efficiency with the Sentieon ctDNA Analysis Pipeline
- 标题(中文):使用 Sentieon ctDNA 分析管道高精度、高效地处理 UMI 数据集
- 发表期刊:bioRxiv
- 作者单位:Sentieon
- 发表年份:2022
- 文章地址:
- https://doi.org/10.1101/2022.06.03.494742
液体活检能够识别低等位基因频率 (AF) 肿瘤变异和新颖的临床应用,例如最小残留病 (MRD) 监测。然而,挑战仍然存在,主要是由于样本量有限和低 AF 变体的读取计数低。由于 AF 较低,一些具有临床意义的变异很难与 PCR 扩增和测序引入的错误区分开来。独特分子标识符 (UMI) 的开发是为了进一步降低碱基错误率并提高变异检出准确性,从而更好地区分背景错误和真实体细胞变异。虽然多个 UMI 感知的 ctDNA 分析流程已发布并采用,但其准确性和运行效率还有待提高。在这项研究中,研究者提出了 Sentieon ctDNA 管道,这是一种快速、准确的解决方案,用于从 ctDNA 测序数据中调用小型体细胞变异。该管道由四个核心模块组成:对齐、共识生成、变体调用和变体过滤。
在该研究中,研究者提出了 Sentieon ctDNA 分析流程,并进行了模拟数据和真实数据的基准测试。与其他已有分析流程相比,Sentieon ctDNA 分析流程在具有有最好的检出精确度并具有高效分析速度。
Sentieon软件介绍
Sentieon为完整的纯软件基因变异检测二级分析方案,其分析流程完全忠于BWA、GATK、MuTect2、STAR、Minimap2、Fgbio、picard等金标准的数学模型。在匹配开源流程分析结果的前提下,大幅提升WGS、WES、Panel、UMI、ctDNA、RNA等测序数据的分析效率和检出精度,并匹配目前全部第二代、三代测序平台。
Sentieon软件团队拥有丰富的软件开发及算法优化工程经验,致力于解决生物数据分析中的速度与准确度瓶颈,为来自于分子诊断、药物研发、临床医疗、人群队列、动植物等多个领域的合作伙伴提供高效精准的软件解决方案,共同推动基因技术的发展。
截至2023年3月份,Sentieon已经在全球范围内为1300+用户提供服务,被世界一级影响因子刊物如NEJM、Cell、Nature等广泛引用,引用次数超过700篇。此外,Sentieon连续数年摘得了Precision FDA、Dream Challenges等多个权威评比的桂冠,在业内获得广泛认可。
软件试用: https://www.insvast.com/sentieon