文献解读-Genome-wide imputation using the practical haplotype graph in the heterozygous crop cassava

简介: PHG是一种将基因组简化为一组单倍型的方法。这种方法可用于从稀疏的基因分型信息中预测杂合子物种中的全基因组单倍型。它的高精度,特别是在稀有等位基因中,在非常低的测序深度下,使其成为一种潜在的强大插补工具。

文献解读-Agrigenomics.png

关键词:农业;基因测序;变异检测;

文献简介

  • 标题(英文):Genome-wide imputation using the practical haplotype graph in the heterozygous crop cassava
  • 标题(中文):使用杂合作物木薯中的实用单倍型图进行全基因组插补
  • 发表期刊:G3
  • 作者单位:康奈尔大学等
  • 发表年份:2021
  • 文章地址:https://doi.org/10.1093/g3journal/jkab383

1.png

图1 文献简介

自基因组测序出现以来,基因组选择和全基因组关联等基因组应用变得越来越普遍。测序的成本在过去二十年中有所下降;然而,基因分型成本仍然无法为这些基因组应用收集大型数据集,特别是在资源不那么丰富的非模型物种中。基因型插补使得从有限的输入数据中推断出全基因组信息成为可能,使基因组应用的大采样更加可行。在必须定相的杂合子物种中,插补变得越来越困难。实用单倍型图(PHG)是最近开发的工具,可以使用单倍型参考面板准确估算基因型。研究者展示了PHG在高度杂合作物木薯(Manihot esculenta)中插补基因组信息的能力。准确定相的单倍型是从不同个体的同源性运行中采样的,以填充 PHG,事实证明这比依靠计算定相方法更准确。PHG使用稀疏的略读测序输入实现了高插补准确性,这在交叉验证测试中转化为实质性的基因组预测准确性。与标准插补工具 Beagle 相比,PHG 显示出更高的插补准确性,尤其是在预测稀有等位基因方面。


测序流程

在基因组数据分析部分,研究者使用Sentieon软件进行突变检测。

2-3整_画板 1.png

图2 Sentieon的作用

3.jpeg

图3 方法流程图

m_jkab383f8.jpeg

图4 模拟基因型的插补准确性

Sentieon软件团队拥有丰富的软件开发及算法优化工程经验,致力于解决生物数据分析中的速度与准确度瓶颈,为来自于分子诊断、药物研发、临床医疗、人群队列、动植物等多个领域的合作伙伴提供高效精准的软件解决方案,共同推动基因技术的发展。 截至2023年3月份,Sentieon已经在全球范围内为1300+用户提供服务,被世界一级影响因子刊物如NEJM、Cell、Nature等广泛引用,引用次数超过700篇。此外,Sentieon连续数年摘得了Precision FDA、Dream Challenges等多个权威评比的桂冠,在业内获得广泛认可。


文献讨论

5.png

图5 文献讨论

PHG展示了作为杂合作物基因型填充工具的高准确性和潜力,尤其在稀有和杂合等位基因的调用方面表现出色。其基因型填充准确性与等位基因频率的关系较弱,突显了预测稀有等位基因的能力。在0.5×或更高测序深度时,PHG在模拟和实证实验中均表现出一致的全基因组变异填充能力。基于单倍型的基因组表示使PHG能够克服测序和组装错误、重复序列和不良比对等问题,为作物基因组学研究提供了有力的工具,在杂合作物研究中具有广阔的应用前景。


总结

综上所述,PHG是一种将基因组简化为一组单倍型的方法。这种方法可用于从稀疏的基因分型信息中预测杂合子物种中的全基因组单倍型。它的高精度,特别是在稀有等位基因中,在非常低的测序深度下,使其成为一种潜在的强大插补工具。

目录
相关文章
|
12月前
|
机器学习/深度学习 人工智能 数据可视化
首个全自动科学发现AI系统,Transformer作者创业公司Sakana AI推出AI Scientist
【9月更文挑战第11天】Sakana AI公司近日推出全球首个全自动科学发现AI系统——AI Scientist,实现了人工智能在科学研究领域的重大突破。AI Scientist不仅能独立完成从假设提出到实验设计、数据分析及论文撰写的全过程,还能通过模拟评审提升研究成果的质量。该系统已成功应用于机器学习的多个子领域,并产出达到顶级会议标准的论文。尽管其高效性备受赞誉,但也引发了关于研究可信度和潜在风险的讨论。Sakana AI强调,系统具备可追溯的决策过程与严格的评审机制,确保了研究的可靠性和透明度。论文详情参见:[链接]。
208 6
|
12月前
|
存储 人工智能 前端开发
AI 网关零代码解决 AI 幻觉问题
本文主要介绍了 AI Agent 的背景,概念,探讨了 AI Agent 网关插件的使用方法,效果以及实现原理。
155 14
|
12月前
|
机器学习/深度学习 测试技术
DeepSeek开源数学大模型,高中、大学定理证明新SOTA
【9月更文挑战第11天】DeepSeek团队近日发布了开源数学大模型DeepSeek-Prover-V1.5,在高中和大学级别的定理证明任务上取得SOTA成果。该模型基于语言模型,通过优化训练和推理流程,在多个基准测试集中表现优异。它引入了RMaxTS变体以生成多样化证明路径,并结合大规模数学预训练、在线强化学习等技术,显著提升了性能。尽管如此,该模型在更复杂问题及计算资源需求方面仍面临挑战。[报告链接](https://arxiv.org/pdf/2408.08152)。
447 9
|
8月前
|
Ubuntu NoSQL 关系型数据库
《docker基础篇:6.本地镜像发布到私有库》包括本地镜像发布到私有库流程、docker regisry是什么、将本地镜像推送到私有库
《docker基础篇:6.本地镜像发布到私有库》包括本地镜像发布到私有库流程、docker regisry是什么、将本地镜像推送到私有库
264 29
|
人工智能 IDE 程序员
一文梳理我们是如何打造出国内领先的 AI 编程助手「通义灵码」
大语言模型的革命性突破使智能编程成为了可能,通义灵码正是基于通义大模型打造的 AI 编程助手,通过 IDE 插件的形式提供代码补全、单元测试生成等功能,能达到毫秒级的响应速度。目前,通义灵码已在阿里云内部及多家企业中应用,阿里云也在探索多智能体产品,即 AI 程序员,助力数字世界的蓬勃发展,颠覆 IT 生产力。
15491 230
|
10月前
|
Ubuntu Linux Shell
Sentieon软件快速入门指南
Sentieon为纯CPU计算加速软件,完全适配主流CPU计算架构:Intel、AMD、海光等X86架构CPU,华为鲲鹏、阿里倚天等ARM架构CPU。可灵活部署在实验室单机工作站、HPC集群、超算中心和云计算中心,保持同一套流程下不同规模数据计算结果的一致性。Sentieon软件团队拥有丰富的软件开发及算法优化工程经验,致力于解决生物数据分析中的速度与准确度瓶颈,为来自于分子诊断、药物研发、临床医疗、人群队列、动植物等多个领域的合作伙伴提供高效精准的软件解决方案,共同推动基因技术的发展。
360 4
Sentieon软件快速入门指南
|
网络协议 网络架构
OSI 模型和 TCP/IP 模型的异同
OSI 模型和 TCP/IP 模型的异同
301 1
|
SQL 人工智能 自然语言处理
一次中稿10篇EMNLP22,达摩院对话智能团队在研究什么
达摩院Conversational AI团队在EMNLP 2022上发表了10篇论文,涵盖了任务型对话、表格型对话、文档型对话、多模态对话和对话终身学习等多个前沿方向。团队构建了首个大规模中文任务型对话评估数据集CGoDial,用于提升对话系统的真实世界表现,并提出了一种新的预训练模型STAR,增强模型对复杂和抽象信息查询的处理能力。此外,他们还研究了多模态情感分析和对话情绪识别,以及终身学习对话系统的解决方案,以减少灾难性遗忘问题。这些研究旨在推动对话智能的发展,提高人机交互的效率和准确性。
|
人工智能 IDE 程序员
通义灵码:AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理
SDCon 全球软件技术大会上,阿里云通义灵码团队分享了关于 AI 辅助编码的最新研究与实践,随着 AIGC 技术的发展,软件研发领域将迎来智能化的新高度,助力 DevOps 流程优化,提升研发效率和研发幸福感。
13957 11
|
11月前
|
算法 数据挖掘 Shell
「毅硕|生信教程」 micromamba:mamba的C++实现,超越conda
还在为生信软件的安装配置而烦恼?micromamba(micromamba是mamba包管理器的小型版本,采用C++实现,具有mamba的核心功能,且体积更小,可以脱离conda独立运行,更易于部署)帮你解决!
344 1