Sentieon | 每周文献-Multi-omics-第三十一期

简介: Sentieon | 每周文献-Multi-omics-第三十一期

多组学系列文章-1

  • 标题(英文):A community effort to identify and correct mislabeled samples in proteogenomic studies
  • 标题(中文):社区努力识别和纠正蛋白质基因组研究中标签错误的样本
  • 发表期刊:Patterns
  • 作者单位:西奈山伊坎医学院、Sentieon 公司等
  • 发表年份:2021
  • 文章地址:
  • https://doi.org/10.1016/j.patter.2021.100245

 

 

样本错误标记或错误注释一直是科学研究中长期存在的问题,由于多组学工作流程的复杂性,在大规模多组学研究中尤其普遍。迫切需要实施质量控制,以自动筛选和纠正多组学研究中的样本错误标签或错误注释。在该研究中,研究者描述了众precisionFDA NCI-CPTAC Multi-omics Enabled Sample Mislabeling Correction Challenge,它为综合蛋白质组学研究的错误标签识别和校正方法的系统基准测试和评估提供了一个框架。该挑战赛收到了来自国内外数据科学家的大量提交材料,在提交的方法中观察到的性能差异很大。表现最好的团队和挑战组织者之间的挑战后合作创建了一个开源软件 COSMO,该软件在模拟和真实多组学数据集中的错误标记识别和纠正方面表现出高精度和稳健性。

 

 

 

总之,样本标记错误可能会对组学研究中的生物学结论产生重大影响,而 COSMO 提供了一种自动化解决方案来主动捕获和修复这些错误。

多组学系列文章-2

  • 标题(英文):Children’s rare disease cohorts: an integrative research and clinical genomics initiative
  • 标题(中文):儿童罕见病队列:综合研究和临床基因组学计划
  • 发表期刊:npj|Genomic Medicine
  • 作者单位:波士顿儿童医院等
  • 发表年份:2020
  • 文章地址:
  • https://doi.org/10.1038/s41525-020-0137-0

 

虽然基因组数据经常是在不同的研究方案和不同的临床和研究制度下收集的,但简化测序策略以创建统一的数据库是有好处的,特别是在儿科罕见病领域。寻求为研究和临床实践实施统一基因组学工作流程的研究医院面临着众多挑战,因为它们需要满足不同环境和许多利益相关者(包括临床医生、研究人员和测序提供商)的独特要求和目标。该研究中,研究者介绍了在波士顿儿童医院 (BCH) 完成的儿童罕见病队列计划 (CRDC) 第一阶段的成果。研究者开发了一个可广泛共享的数据库,其中包含来自 15 个儿科罕见疾病队列的 2441 个外显子组,其中主要贡献来自早发性癫痫和早发性炎症性肠病。所有测序数据均在基因组学学习系统 (GLS) 中与表型和研究数据进行整合和组合。表型都是手动注释的,并从患者病历中自动提取。GLS 集成了分析系统,包括用于自动变异分类和优先级排序的机器学习算法,以及通过临床记录的自然语言处理 (NLP) 提取表型。该 GLS 可扩展到其他分析系统以及不断增长的基因组和其他类型数据的研究和临床集合。

在该研究中,研究者使用Sentieon软件进行胚系变异检测。

 

 

 

在该研究中,研究者描述了如何扩展 BCH 队列测序的工作流程,为基因组学研究提供支持。描述了收集到的数据以及如何将其集成到 GLS 中,以安全和透明的方式将商业应用程序和定制开发结合起来,并讨论了这些数据和 GLS 对患者、研究人员和临床医生的价值。最后,提供了一个数据机构整合模型,以支持发现和临床使用。这项工作表明,协调同意、开发模块化 GLS 以及整合临床和研究数据源是有价值的,而能够做到这一点取决于许多利益相关者的贡献。

Sentieon软件介绍

Sentieon为完整的纯软件基因变异检测二级分析方案,其分析流程完全忠于BWA、GATK、MuTect2、STAR、Minimap2、Fgbio、picard等金标准的数学模型。在匹配开源流程分析结果的前提下,大幅提升WGS、WES、Panel、UMI、ctDNA、RNA等测序数据的分析效率和检出精度,并匹配目前全部第二代、三代测序平台。

 

Sentieon软件团队拥有丰富的软件开发及算法优化工程经验,致力于解决生物数据分析中的速度与准确度瓶颈,为来自于分子诊断、药物研发、临床医疗、人群队列、动植物等多个领域的合作伙伴提供高效精准的软件解决方案,共同推动基因技术的发展。

截至2023年3月份,Sentieon已经在全球范围内为1300+用户提供服务,被世界一级影响因子刊物如NEJM、Cell、Nature等广泛引用,引用次数超过700篇。此外,Sentieon连续数年摘得了Precision FDA、Dream Challenges等多个权威评比的桂冠,在业内获得广泛认可。

 

软件试用: https://www.insvast.com/sentieon

 

目录
相关文章
|
9天前
|
编解码 算法 数据挖掘
Sentieon | 每周文献-Multi-omics-第四十一期
**多组学研究揭示人类前额皮质发育中的遗传变化与转录组协调,文章发表于2020年《Cell Reports》,利用Sentieon软件分析全基因组和RNA测序数据,发现约12,000个基因表达在协调的胎儿晚期转变中变化,关联神经精神疾病。另一研究对比了EGFR生物标志物检测方法对胶质母细胞瘤精准医疗的影响, Sentieon软件同样用于变异检测,强调了检测方法的一致性和比较的重要性。Sentieon是高效精准的基因变异检测软件,广泛应用在多个生命科学领域。**
34 6
|
2月前
|
算法 数据挖掘
Sentieon | 每周文献-Population Sequencing-第三十四期
Sentieon | 每周文献-Population Sequencing-第三十四期
26 0
|
3月前
|
算法 数据挖掘
Sentieon | 每周文献-Population Sequencing-第二十三期
Sentieon | 每周文献-Population Sequencing-第二十三期
21 1
|
23天前
|
Java 数据挖掘 Go
JCR一区7.7分|单细胞联合bulk-seq的线粒体自噬,分析方法都挺好
这篇文章介绍了研究者通过分析单细胞和Bulk RNA测序数据,鉴定出18个与胃癌(GC)进展相关的线粒体自噬相关基因(MRG),并建立了基于这些基因的预后模型。研究发现GABARAPL2和CDC37可能是GC的预后标志物和潜在治疗靶点。此外,分析揭示了细胞间通讯模式和免疫浸润状态,暗示MRG可能影响GC的免疫治疗响应。整体而言,这项工作为GC的诊断和治疗提供了新见解。
16 0
|
3月前
|
安全 算法 数据挖掘
Sentieon | 每周文献-Multi-omics-第二十期
Sentieon | 每周文献-Multi-omics-第二十期
52 0
|
3月前
|
算法 数据挖掘
Sentieon | 每周文献-Population Sequencing-第二十四期
Sentieon | 每周文献-Population Sequencing-第二十四期
23 1
|
3月前
|
算法 数据挖掘
Sentieon | 每周文献-Clinical Trial-第二十二期
Sentieon | 每周文献-Clinical Trial-第二十二期
22 2
|
4月前
|
算法 安全 数据挖掘
Sentieon | 每周文献-Tumor Sequencing-第十四期
Sentieon | 每周文献-Tumor Sequencing-第十四期
42 0
|
9月前
|
数据采集 机器学习/深度学习 算法
【论文速递】EMNLP 2020 - 将事件抽取作为机器阅读理解任务
事件抽取(Event extraction, EE)是一项重要的信息抽取任务,旨在抽取文本中的事件信息。以前的EE方法通常将其建模为分类任务
85 0
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
16CODEIPPROMPT:顶会ICML’23 从GitHub到AI,探索代码生成的侵权风险与缓解策略的最新进展:训练数据`有限制性许可;模型微调+动态Token过滤【网安AIGC专题11.8】
16CODEIPPROMPT:顶会ICML’23 从GitHub到AI,探索代码生成的侵权风险与缓解策略的最新进展:训练数据`有限制性许可;模型微调+动态Token过滤【网安AIGC专题11.8】
84 1