Sentieon | 每周文献-Benchmark and Method Study-第三十期

简介: Sentieon | 每周文献-Benchmark and Method Study-第三十期

基准与方法研究系列文章-1

  • 标题(英文):Sentieon DNAscope LongRead – A highly Accurate, Fast, and Efficient Pipeline for Germline Variant Calling from PacBio HiFi reads
  • 标题(中文):Sentieon DNAscope LongRead – 用于 PacBio HiFi 读取的种系变异识别的高度准确、快速且高效的管道
  • 发表期刊:bioRxiv
  • 作者单位:Sentieon和Pacbio
  • 发表年份:2022
  • 文章地址:
  • https://doi.org/10.1101/2022.06.01.494452

 

 

PacBio ® HiFi测序是首个提供经济且高精度长读长测序的技术,平均读长大于10kb,平均碱基准确度达到99.8% 。在该研究中,研究者推出了 DNAscope LongRead,这是一种用于从 PacBio ® HiFi 读取中进行种系变异调用的准确而高效的管道。DNAscope LongRead 是 Sentieon DNAscope 工具的修改和扩展,DNAscope 工具是一款荣获 FDA 奖项的精确变异识别器。DNAscope LongRead 计算效率高,并且高度准确,在最新 GIAB 基准数据集上,HiFi 样本的精确度和召回率超过 99.83%,并且对基准数据集以及上游文库制备和测序的变化具有鲁棒性。

 

 

 

在本文中,研究者介绍了 DNAscope LongRead,这是一种高度准确、高效、稳健且可扩展的管道,用于从 PacBio HiFi 读取中进行种系变异调用。与 Precision FDA Truth Challenge V2 获胜变异检出管道相比,DNAscope LongRead 管道在所有基准区域中平均误差降低了 15%。

基准与方法研究系列文章-2

  • 标题(英文):Processing UMI Datasets at High Accuracy and Efficiency with the Sentieon ctDNA Analysis Pipeline
  • 标题(中文):使用 Sentieon ctDNA 分析管道高精度、高效地处理 UMI 数据集
  • 发表期刊:bioRxiv
  • 作者单位:Sentieon
  • 发表年份:2022
  • 文章地址:
  • https://doi.org/10.1101/2022.06.03.494742

 

液体活检能够识别低等位基因频率 (AF) 肿瘤变异和新颖的临床应用,例如最小残留病 (MRD) 监测。然而,挑战仍然存在,主要是由于样本量有限和低 AF 变体的读取计数低。由于 AF 较低,一些具有临床意义的变异很难与 PCR 扩增和测序引入的错误区分开来。独特分子标识符 (UMI) 的开发是为了进一步降低碱基错误率并提高变异检出准确性,从而更好地区分背景错误和真实体细胞变异。虽然多个 UMI 感知的 ctDNA 分析流程已发布并采用,但其准确性和运行效率还有待提高。在这项研究中,研究者提出了 Sentieon ctDNA 管道,这是一种快速、准确的解决方案,用于从 ctDNA 测序数据中调用小型体细胞变异。该管道由四个核心模块组成:对齐、共识生成、变体调用和变体过滤。

 

 

 

在该研究中,研究者提出了 Sentieon ctDNA 分析流程,并进行了模拟数据和真实数据的基准测试。与其他已有分析流程相比,Sentieon ctDNA 分析流程在具有有最好的检出精确度并具有高效分析速度。

Sentieon软件介绍

Sentieon为完整的纯软件基因变异检测二级分析方案,其分析流程完全忠于BWA、GATK、MuTect2、STAR、Minimap2、Fgbio、picard等金标准的数学模型。在匹配开源流程分析结果的前提下,大幅提升WGS、WES、Panel、UMI、ctDNA、RNA等测序数据的分析效率和检出精度,并匹配目前全部第二代、三代测序平台。

 

Sentieon软件团队拥有丰富的软件开发及算法优化工程经验,致力于解决生物数据分析中的速度与准确度瓶颈,为来自于分子诊断、药物研发、临床医疗、人群队列、动植物等多个领域的合作伙伴提供高效精准的软件解决方案,共同推动基因技术的发展。

截至2023年3月份,Sentieon已经在全球范围内为1300+用户提供服务,被世界一级影响因子刊物如NEJM、Cell、Nature等广泛引用,引用次数超过700篇。此外,Sentieon连续数年摘得了Precision FDA、Dream Challenges等多个权威评比的桂冠,在业内获得广泛认可。

 

软件试用: https://www.insvast.com/sentieon

 

目录
相关文章
|
机器学习/深度学习 算法框架/工具
什么是ablation study(消融实验)?
什么是ablation study(消融实验)?
什么是ablation study(消融实验)?
|
2月前
|
算法 数据挖掘
文献讨论-Chromosome-Level Genome Assembly of the Green Peafowl (Pavo muticus)
关键词:长读长测序;基因测序;变异检测; 标题(英文):Chromosome-Level Genome Assembly of the Green Peafowl (Pavo muticus) 标题(中文):绿孔雀(Pavo muticus)的染色体级基因组组装 该研究发现了目前最全面、最完整的绿孔雀基因组,它将成为未来绿孔雀生态学、进化和保护研究的宝贵资源。
44 0
|
4月前
|
机器学习/深度学习 存储 开发框架
【博士每天一篇文献-算法】NICE Neurogenesis Inspired Contextual Encoding for Replay-free Class Incremental Learn
NICE(Neurogenesis Inspired Contextual Encoding)是一种新型深度神经网络架构,旨在通过模拟生物神经系统的成熟过程来解决类别增量学习中的灾难性遗忘问题,无需重放旧样本即可实现有效的增量学习。
63 5
|
7月前
|
机器学习/深度学习 SQL 存储
人工智能平台PAI 操作报错合集之机器学习PAI训练的时候logging.info('Train and evaluate finish')后, 总会报出来一个错如何解决
阿里云人工智能平台PAI (Platform for Artificial Intelligence) 是阿里云推出的一套全面、易用的机器学习和深度学习平台,旨在帮助企业、开发者和数据科学家快速构建、训练、部署和管理人工智能模型。在使用阿里云人工智能平台PAI进行操作时,可能会遇到各种类型的错误。以下列举了一些常见的报错情况及其可能的原因和解决方法。
|
7月前
|
算法 数据挖掘
Sentieon | 每周文献-Long Read Sequencing-第十八期
Sentieon | 每周文献-Long Read Sequencing-第十八期
49 1
|
7月前
|
机器学习/深度学习 算法 数据挖掘
Sentieon | 每周文献-Benchmark and Method Study-第十九期
Sentieon | 每周文献-Benchmark and Method Study-第十九期
66 0
|
7月前
|
NoSQL 数据挖掘 数据库
Sentieon | 每周文献-Long Read Sequencing-第二十九期
Sentieon | 每周文献-Long Read Sequencing-第二十九期
55 0
|
7月前
|
安全 算法 数据挖掘
Sentieon | 每周文献-Multi-omics-第二十期
Sentieon | 每周文献-Multi-omics-第二十期
83 0
|
7月前
|
算法 数据挖掘 芯片
Sentieon | 每周文献-Gene Editing-第二十八期
Sentieon | 每周文献-Gene Editing-第二十八期
45 0
|
机器学习/深度学习 算法 数据挖掘
Sentieon | 每周文献-Benchmark and Method Study(基准与方法研究)-第八期
Sentieon | 每周文献-Benchmark and Method Study(基准与方法研究)-第八期
99 0