Sentieon | 每周文献-Benchmark and Method Study-第十九期

简介: Sentieon | 每周文献-Benchmark and Method Study-第十九期

基准与方法研究系列文章-1


  • 标题(英文):DNAscope: High accuracy small variant calling using machine learning
  • 标题(中文):DNAscope:使用机器学习的高精度小变异调用
  • 发表期刊:bioRxiv
  • 作者单位:Sentieon公司
  • 发表年份:2022
  • 文章地址
    https://doi.org/10.1101/2022.05.20.492556

 

 

图1 文献介绍

研究者介绍的 DNAscope 是一种精确高效的种系小变异调用器。DNAscope 结合了 GATK 的 HaplotypeCaller 强大而成熟的数学以及机器学习的基因分型模型。DNAscope和DNAseq(Sentieon的GATK匹配种系变异调用管道)的基准测试表明,DNAscope能以更低的计算成本实现更高的SNP和InDel准确性。GATK HaplotypeCaller 因其高精度而成为行业标准的小型变异体调用器。通过将贝叶斯统计模型与reads单倍型的直接建模和变异过滤器相结合,HaplotypeCaller 在各种公共和第三方基准测试中取得了最高性能。然而,包括 HaplotypeCaller 在内的基于短reads技术的现有变异调用器与高置信度变异调用的匹配并不完美,尤其是在同源多聚物和其他重复位点等复杂基因组区域。这些复杂区域中有许多与临床相关,随着下一代测序数据越来越多地用于临床检测,提高这些位点的变异调用准确性变得越来越重要。

 

 

图2 DNAscope 方法概述

 

为了评估 DNAscope 在不同个体中的变异调用准确性,研究者使用 Sentieon 的 DNAscope 和 DNAseq(符合 GATK 种系最佳实践)管道,使用来自三个 GIAB 样本的公开数据来调用变异:HG002、HG003 和 HG004。样本 HG001 和 HG005 没有进行基准测试,因为它们是在 DNAscope 模型训练过程中使用的。


 

图3 DNAscope 和 DNAseq 的精确召回曲线

 

图4 对整个 GA4GH 分层区域进行评估,HG002 深度为 30×

图5 对瓶中基因组样本 HG002、HG003、HG004 进行多深度测序评估

 

图6 DNAscope 在多个 AWS C6i 实例上的运行时


综上所述,在这项工作中,研究者证明了 DNAscope 在不同样本和不同覆盖水平上都比 DNAseq 获得了更高的准确性。通过使用 GA4GH 分层区域进行分层分析,证实了 DNAscope 在大多数分层区域中的高准确性,并强调了 DNAscope 在含有基因组区域的 indels 和分层中更高的准确性,而在这些区域中,变异调用更为困难。DNAscope将GATK的HaplotypeCaller中使用的成熟的数学和统计模型与变异基因分型的机器学习相结合,在保持计算效率的同时实现了更高的准确性。

 

基准与方法研究系列文章-2


  • 标题(英文):Unifying comprehensive genomics and transcriptomics in individual cells to illuminate oncogenic and drug resistance mechanisms
  • 标题(中文):统一单个细胞的综合基因组学和转录组学,揭示致癌和耐药机制
  • 发表期刊:bioRxiv
  • 作者单位:BioSkryb Genomics公司
  • 发表年份:2022
  • 文章地址
    https://doi.org/10.1101/2022.04.29.489440

 

图1 文献介绍


在缺乏潜在基因组贡献的情况下发现转录变异会阻碍对疾病分子机制的理解。为了评估单个细胞中的这种协调性,研究者利用新的工作流程 ResolveOME,利用主模板定向扩增(PTA)的特性,结合全转录 RNA-seq 对单核苷酸变异进行准确、完整的基因组评估。在样本数据分析部分,研究者将Sentieon不同工具模块进行整合,构建了BJ-WGS分析管道。

 

图2 Sentieon的作用

 

图3 工作流性能特征

在该研究中,首先,研究者在分析转录组的同时,还证明了细胞身份背后强大的等位基因代表性。其次,举例说明了当肿瘤细胞受到选择性压力时,基因组和转录组状态的可塑性。第三,展示了利用同步的多种分子模式无偏见地识别恶性细胞克隆,这可以提高分子病变检测的灵敏度。

 

Sentieon软件介绍

Sentieon为完整的纯软件基因变异检测二级分析方案,其分析流程完全忠于BWA、GATK、MuTect2、STAR、Minimap2、Fgbio、picard等金标准的数学模型。在匹配开源流程分析结果的前提下,大幅提升WGS、WES、Panel、UMI、ctDNA、RNA等测序数据的分析效率和检出精度,并匹配目前全部第二代、三代测序平台。


 

 

Sentieon软件团队拥有丰富的软件开发及算法优化工程经验,致力于解决生物数据分析中的速度与准确度瓶颈,为来自于分子诊断、药物研发、临床医疗、人群队列、动植物等多个领域的合作伙伴提供高效精准的软件解决方案,共同推动基因技术的发展。

截至2023年3月份,Sentieon已经在全球范围内为1300+用户提供服务,被世界一级影响因子刊物如NEJM、Cell、Nature等广泛引用,引用次数超过700篇。此外,Sentieon连续数年摘得了Precision FDA、Dream Challenges等多个权威评比的桂冠,在业内获得广泛认可。

软件试用:https://www.insvast.com/sentieon

目录
相关文章
|
运维 负载均衡 网络协议
linux网络管理(链路聚合、桥接网络、故障排查、常用工具)
网卡的链路聚合就是将多块网卡连接起来,当一块网卡损坏,网络依旧可以正常运行,可以有效的防止因为网卡损坏带来的损失,同时也可以提高网络访问速度。
1639 0
linux网络管理(链路聚合、桥接网络、故障排查、常用工具)
【最佳实践】宜搭的报表分析功能
“单据表单”和”流程表单”中提交的数据,可以在”报表页面”中作为数据源,进行进一步的分析。当一个表单中存在明细时,为了支持分析,宜搭进行了一些额外的处理。下面以一个具体场景(进货单)进行具体介绍
【最佳实践】宜搭的报表分析功能
|
3月前
|
数据可视化 Java BI
将 Spring 微服务与 BI 工具集成:最佳实践
本文探讨了 Spring 微服务与商业智能(BI)工具集成的潜力与实践。随着微服务架构和数据分析需求的增长,Spring Boot 和 Spring Cloud 提供了构建可扩展、弹性服务的框架,而 BI 工具则增强了数据可视化与实时分析能力。文章介绍了 Spring 微服务的核心概念、BI 工具在企业中的作用,并深入分析了两者集成带来的优势,如实时数据处理、个性化报告、数据聚合与安全保障。同时,文中还总结了集成过程中的最佳实践,包括事件驱动架构、集中配置管理、数据安全控制、模块化设计与持续优化策略,旨在帮助企业构建高效、智能的数据驱动系统。
211 1
将 Spring 微服务与 BI 工具集成:最佳实践
|
4月前
|
传感器 编解码 数据可视化
GEE数据集:2017-2024年全球多源遥感数据融合的全新10米数据集(无量纲)Satellite Embedding V1
Google Satellite Embedding 数据集提供全球10米分辨率的64维嵌入向量,编码地表条件的时间轨迹,适用于变化检测与地理分析。
459 0
|
网络协议 应用服务中间件 网络安全
odoo17在线聊天报错提示 Couldn‘t bind the websocket...
当 Odoo 17 报错 "Couldn't bind the websocket..." 时,通过检查和配置 WebSocket 端口、防火墙规则、代理服务器以及 Odoo 配置文件,可以有效解决此问题。确保每一步操作准确无误,最终重启相关服务,使配置生效。希望这些步骤能帮助您快速恢复 Odoo 的在线聊天功能。
425 1
|
数据可视化 搜索推荐 数据挖掘
数据分析案例-顾客购物数据可视化分析
数据分析案例-顾客购物数据可视化分析
752 0
|
机器学习/深度学习 并行计算 PyTorch
图像检测【YOLOv5】——深度学习
Anaconda的安装配置:(Anaconda是一个开源的Python发行版本,包括Conda、Python以及很多安装好的工具包,比如:numpy,pandas等,其中conda是一个开源包和环境管理器,可以用于在同一个电脑上安装不同版本的软件包,并且可以在不同环境之间切换,是深度学习的必备平台。) 一.Anaconda安装配置. 1.首先进入官网:https://repo.anaconda.com,选择View All Installers. 2.打开看到的界面是Anaconda的所以安装包版本,Anaconda3就代表是Python3版本,后面跟的是发行日期,我选择了最近的2022
224 26
|
安全 Java 数据库连接
Dataphin的数据共享的应用场景和方案
不同的业务场景对数据访问和使用有着各自独特的需求,从简单的数据下载到复杂的跨系统集成,选择合适的数据共享与访问方式至关重要。本文旨在探讨几种常见的Dataphin上的数据共享与访问机制——包括数据复制、数据下载、视图创建、行级及列级权限控制、API数据服务以及JDBC连接等,并分析它们各自的适用场景、优势及限制,以帮助企业更好地根据自身需求做出合理的选择。
429 0
|
前端开发
【vue3】前端实现 生成条形码并调用打印机打印
【vue3】前端实现 生成条形码并调用打印机打印
1473 1
|
存储 数据安全/隐私保护 Python
`zxcvbn`是一个用于密码强度估计的开源库,由Dropbox开发。它基于一系列启发式方法,包括密码字典、常见密码模式、键盘布局等,来评估密码的强度。
`zxcvbn`是一个用于密码强度估计的开源库,由Dropbox开发。它基于一系列启发式方法,包括密码字典、常见密码模式、键盘布局等,来评估密码的强度。