Sentieon | 每周文献-Multi-omics-第三十一期

简介: Sentieon | 每周文献-Multi-omics-第三十一期

多组学系列文章-1

  • 标题(英文):A community effort to identify and correct mislabeled samples in proteogenomic studies
  • 标题(中文):社区努力识别和纠正蛋白质基因组研究中标签错误的样本
  • 发表期刊:Patterns
  • 作者单位:西奈山伊坎医学院、Sentieon 公司等
  • 发表年份:2021
  • 文章地址:
  • https://doi.org/10.1016/j.patter.2021.100245

 

 

样本错误标记或错误注释一直是科学研究中长期存在的问题,由于多组学工作流程的复杂性,在大规模多组学研究中尤其普遍。迫切需要实施质量控制,以自动筛选和纠正多组学研究中的样本错误标签或错误注释。在该研究中,研究者描述了众precisionFDA NCI-CPTAC Multi-omics Enabled Sample Mislabeling Correction Challenge,它为综合蛋白质组学研究的错误标签识别和校正方法的系统基准测试和评估提供了一个框架。该挑战赛收到了来自国内外数据科学家的大量提交材料,在提交的方法中观察到的性能差异很大。表现最好的团队和挑战组织者之间的挑战后合作创建了一个开源软件 COSMO,该软件在模拟和真实多组学数据集中的错误标记识别和纠正方面表现出高精度和稳健性。

 

 

 

总之,样本标记错误可能会对组学研究中的生物学结论产生重大影响,而 COSMO 提供了一种自动化解决方案来主动捕获和修复这些错误。

多组学系列文章-2

  • 标题(英文):Children’s rare disease cohorts: an integrative research and clinical genomics initiative
  • 标题(中文):儿童罕见病队列:综合研究和临床基因组学计划
  • 发表期刊:npj|Genomic Medicine
  • 作者单位:波士顿儿童医院等
  • 发表年份:2020
  • 文章地址:
  • https://doi.org/10.1038/s41525-020-0137-0

 

虽然基因组数据经常是在不同的研究方案和不同的临床和研究制度下收集的,但简化测序策略以创建统一的数据库是有好处的,特别是在儿科罕见病领域。寻求为研究和临床实践实施统一基因组学工作流程的研究医院面临着众多挑战,因为它们需要满足不同环境和许多利益相关者(包括临床医生、研究人员和测序提供商)的独特要求和目标。该研究中,研究者介绍了在波士顿儿童医院 (BCH) 完成的儿童罕见病队列计划 (CRDC) 第一阶段的成果。研究者开发了一个可广泛共享的数据库,其中包含来自 15 个儿科罕见疾病队列的 2441 个外显子组,其中主要贡献来自早发性癫痫和早发性炎症性肠病。所有测序数据均在基因组学学习系统 (GLS) 中与表型和研究数据进行整合和组合。表型都是手动注释的,并从患者病历中自动提取。GLS 集成了分析系统,包括用于自动变异分类和优先级排序的机器学习算法,以及通过临床记录的自然语言处理 (NLP) 提取表型。该 GLS 可扩展到其他分析系统以及不断增长的基因组和其他类型数据的研究和临床集合。

在该研究中,研究者使用Sentieon软件进行胚系变异检测。

 

 

 

在该研究中,研究者描述了如何扩展 BCH 队列测序的工作流程,为基因组学研究提供支持。描述了收集到的数据以及如何将其集成到 GLS 中,以安全和透明的方式将商业应用程序和定制开发结合起来,并讨论了这些数据和 GLS 对患者、研究人员和临床医生的价值。最后,提供了一个数据机构整合模型,以支持发现和临床使用。这项工作表明,协调同意、开发模块化 GLS 以及整合临床和研究数据源是有价值的,而能够做到这一点取决于许多利益相关者的贡献。

Sentieon软件介绍

Sentieon为完整的纯软件基因变异检测二级分析方案,其分析流程完全忠于BWA、GATK、MuTect2、STAR、Minimap2、Fgbio、picard等金标准的数学模型。在匹配开源流程分析结果的前提下,大幅提升WGS、WES、Panel、UMI、ctDNA、RNA等测序数据的分析效率和检出精度,并匹配目前全部第二代、三代测序平台。

 

Sentieon软件团队拥有丰富的软件开发及算法优化工程经验,致力于解决生物数据分析中的速度与准确度瓶颈,为来自于分子诊断、药物研发、临床医疗、人群队列、动植物等多个领域的合作伙伴提供高效精准的软件解决方案,共同推动基因技术的发展。

截至2023年3月份,Sentieon已经在全球范围内为1300+用户提供服务,被世界一级影响因子刊物如NEJM、Cell、Nature等广泛引用,引用次数超过700篇。此外,Sentieon连续数年摘得了Precision FDA、Dream Challenges等多个权威评比的桂冠,在业内获得广泛认可。

 

软件试用: https://www.insvast.com/sentieon

 

目录
相关文章
|
7月前
|
编解码 算法 数据挖掘
Sentieon | 每周文献-Multi-omics-第四十一期
**多组学研究揭示人类前额皮质发育中的遗传变化与转录组协调,文章发表于2020年《Cell Reports》,利用Sentieon软件分析全基因组和RNA测序数据,发现约12,000个基因表达在协调的胎儿晚期转变中变化,关联神经精神疾病。另一研究对比了EGFR生物标志物检测方法对胶质母细胞瘤精准医疗的影响, Sentieon软件同样用于变异检测,强调了检测方法的一致性和比较的重要性。Sentieon是高效精准的基因变异检测软件,广泛应用在多个生命科学领域。**
76 6
|
7月前
|
算法 数据挖掘
Sentieon | 每周文献-Population Sequencing-第二十三期
Sentieon | 每周文献-Population Sequencing-第二十三期
42 1
|
7月前
|
算法 数据挖掘
Sentieon | 每周文献-Population Sequencing-第三十四期
Sentieon | 每周文献-Population Sequencing-第三十四期
53 0
|
7月前
|
算法 数据挖掘 测试技术
Sentieon | 每周文献-Benchmark and Method Study-第三十期
Sentieon | 每周文献-Benchmark and Method Study-第三十期
47 1
|
4月前
【博士每天一篇文献-模型】A mechanistic model of connector hubs, modularity and cognition
本文提出了一个机制模型,阐释了连接中枢在人类大脑网络中的作用及其对认知表现的影响,揭示了连接中枢的多样性与大脑网络模块化和认知功能之间的正向关系。
46 0
【博士每天一篇文献-模型】A mechanistic model of connector hubs, modularity and cognition
|
4月前
|
机器学习/深度学习 算法 关系型数据库
【博士每天一篇文献-实验】Is a Modular Architecture Enough?
本文探讨了模块化架构在机器学习中的有效性,通过实验展示了模块化系统在特定任务中通过专业化显著提升性能的潜力,并提出了评估模块化架构性能的新指标,同时指出了当前系统在泛化和性能上的局限性。
34 2
【博士每天一篇文献-实验】Is a Modular Architecture Enough?
|
4月前
|
算法 IDE 开发工具
【博士每天一篇文献-实验】Impact of modular organization on dynamical richness_in cortical networks
本文研究了大脑模块化组织对其动态特性的影响,发现不同耦合强度下的模块化网络展现出不同的活动模式,并通过实验揭示了单键模式在动态丰富性方面的优势,为理解大脑皮层网络的复杂动态提供了新的视角。
21 2
【博士每天一篇文献-实验】Impact of modular organization on dynamical richness_in cortical networks
|
4月前
|
编解码 算法 数据挖掘
【博士每天一篇文献-综述】Modular Brain Networks
本文详细介绍了模块化大脑网络的概念、生物作用以及使用图论工具检测这些网络的方法,探讨了模块化在大脑结构和功能中的证据及其在大脑进化和连接性最小化中的潜在角色,并回顾了网络神经科学领域在模块化大脑网络研究方面的最新进展。
45 4
【博士每天一篇文献-综述】Modular Brain Networks
|
4月前
|
机器学习/深度学习 算法
【博士每天一篇文献-算法】Adult neurogenesis acts as a neural regularizer
本文研究了成人神经发生(adult neurogenesis)在大脑学习过程中的作用,发现其作为一种神经调节器能提高学习泛化能力,并通过在卷积神经网络(CNN)中模拟神经发生,证明了其作为正则化手段与传统技术一样有效,甚至在某些方面更优。
31 6
|
4月前
|
机器学习/深度学习 存储 算法
【博士每天一篇文献-算法】Evolutionary multi-task learning for modular knowledge representation in neuralnetworks
本文提出了一种进化式多任务学习方法(EMTL),用于在神经网络中通过模块化网络拓扑实现模块化知识表示,模仿人脑的模块化结构存储知识,提高了网络的鲁棒性和灵活性,并在奇偶校验问题和基准模式分类任务上验证了其有效性。
37 1