WaveRider for Sentieon,加速云中的下一代测序

简介: Memory Machine软件的WaveRider功能提高了Sentieon性能40%,这是Sentieon基因组分析相对于开源替代品的10倍性能优势的补充。

近日,Big Memory软件的先驱MemVerge®与基因组软件市场领导者Sentieon®宣布展开合作,加速在公有云中进行下一代测序(NGS)。

MemVerge和Sentieon将高效率的云自动化平台与先进的基因组软件引擎相结合,形成了适用于Sentieon的WaveRider。对于试图通过加速任务完成来降低云成本的生物信息学家和生物技术研究人员,Memory Machine软件的WaveRider功能提高了Sentieon性能40%,这是Sentieon基因组分析相对于开源替代品的10倍性能优势的补充。

作为合作的一部分,图片WaveRider for Sentieon用户每月可获得最多5000核小时的免费Sentieon使用权。

01

HZPC的实践:基因组测序处理的显著改善

全球驰名的马铃薯基因组研究市场领导者HZPC面临在云中运行数千个长时间运行的下一代测序作业的成本和时间挑战。随着样本的收集增加,计算时间迅速增加。HZPC需要一个既能缩短计算时间又能减少云成本的平台。使用WaveRider for Sentieon,HZPC看到了显著的性能改善和成本节约。

“我们对WaveRider for Sentieon解决方案的性能印象深刻。初步测试显示出4-5倍加速,我们期望在调优解决方案时进一步改善结果。更快的处理速度再加上利用spot instances显著降低了我们的云成本,” HZPC生物信息学项目负责人Remco Ursem表示,“这个解决方案使我们能够比以往更有效地完成我们的NGS运行,并将帮助我们的研究提升到一个新的水平。”图片

02

WaveRider for Sentieon

Sentieon软件为BWA-MEM、STAR、Minimap2、GATK、Mutect2和大型队列联合调用提供了可替代方案,还提供了具有增强准确性和速度的其他变异调用流程。Sentieon软件支持目前所有可用的短读和长读测序平台,具有:

• 获奖级准确性
• 快速交付时间
• 大幅降低成本

Sentieon工具通过优化的计算算法设计和企业级软件实施实现其效率,并使用行业最经过验证的数学方法实现高准确性。

“通过与MemVerge合作,Sentieon进一步扩大了对其先进基因组软件引擎的访问,并进一步提高了Sentieon市场领先产品的性能,” Sentieon的产品管理总监Frank Hu表示,“通过与MemVerge的Memory Machine Cloud结合,WaveRider for Sentieon解决方案真正成为世界上快且高效的公共云下一代测序(NGS)引擎。”

WaveRider:相对基准的40%速度提升

MMCloud是一个强大而直观的计算软件平台,专为在云端运行数据密集型管道和交互式计算应用而设计。其创新的WaveRider技术能够根据工作负载的实时需求调整云资源。

当在MMCloud上启动Sentieon工作负载时,它们能够智能地利用WaveRider技术,在需要时灵活调配更多资源,而在适当时精准地使用更少资源。这一创新性的技术带来了前所未有的性能提升和成本效益。

在进行WGS基准测试时,WaveRider for Sentieon解决方案相对于基准提高了40%的性能,同时通过使用On-Demand实例,成功降低了34%的云成本。更进一步,通过使用spot instances,我们能够实现更大幅度的云成本降低。这标志着在云计算领域取得了令人瞩目的进展,为用户提供了更高效、更经济的解决方案。

“基因组研究人员在利用公共云的过程中面临的最大障碍是成本、资源效率和易用性,” MemVerge的首席运营官Jon Jiang表示,“我们设计Memory Machine Cloud来通过自动化解决这些挑战。通过致力于将我们强大的云自动化平台与Sentieon领先的二次分析引擎集成,我们正在使基因组分析比以往任何时候都更加高效,最终帮助加速发现。”

WaveRider for Sentieon现已上线。通过此集成解决方案,MemVerge为用户提供免费license访问Sentieon基因组软件,具体免费额度可联系我们进行咨询。

Sentieon系列内容: Sentieon开箱测评
产品已上架云市场,点击立享30天免费试用。

目录
相关文章
|
3月前
|
存储 人工智能 数据格式
总说具身智能的数据太贵,鹏城实验室开源百万规模标准化数据集
【9月更文挑战第18天】鹏城实验室提出的ARIO(All Robots In One)标准,为具身智能领域带来了统一的数据格式、丰富的感知模态及多样化的真实与模拟数据,显著提升了数据集的质量与规模,助力智能系统更好地与物理世界互动。基于此标准构建的大规模数据集包含约300万个片段,覆盖258个系列和321,064个任务,极大地推动了具身智能的研究与发展。然而,该数据集也面临着存储需求高、系统互操作性及应用场景适应性等挑战。论文详情见:http://arxiv.org/abs/2408.10899。
109 11
|
5月前
|
数据采集 数据管理
240万亿巨量数据被洗出,足够训出18个GPT-4!全球23所机构联手,清洗秘籍公开
【7月更文挑战第5天】全球23所机构合作的DCLM项目揭示了数据清洗新范式,从240T海量数据中提炼出2.6T高质量集,提升语言模型效能。DCLM-Baseline数据集在减少40%计算量的同时,使70亿参数模型在MMLU上达到64%准确率,超越MAP-Neo并媲美其他LLMs。然而,数据偏见和伦理问题仍是挑战。[论文链接](https://arxiv.org/abs/2406.11794)**
108 1
|
7月前
|
SQL 分布式计算 数据挖掘
阿里云MaxCompute携手华大基因打造精准医疗应用云平台,十万基因组计算成本降低至1000美金以内
华大基因是中国最领先的基因科技公司,华大基因为消除人类病痛、经济危机、国家灾难、濒危动物保护、缩小贫富差距等方面提供分子遗传层面的技术支持。让我们结合maxcompute的技术特点,看看如何助力华大基因。
2161 13
|
7月前
|
SQL 存储 人工智能
Google BigQuery深度解析:云端大数据分析服务的威力
【4月更文挑战第8天】本文是关于Google Cloud Platform的BigQuery在大数据和云技术领域的应用分析。BigQuery的核心特性包括无服务器、全托管架构,实现高性能的超大规模并行处理,并严格遵循安全与合规标准。在实战应用中,它用于数据湖分析、机器学习与AI,以及实时数据分析与BI。BigQuery的极致性能、易用性和与GCP生态的整合,使其成为云端大数据分析的强大工具,适用于各种行业场景,帮助企业释放数据价值。作者将持续分享相关技巧和最佳实践。
940 0
|
编解码 弹性计算 搜索推荐
阿里云E-HPC+i4p大内存实例,加速寻因生物单细胞数据分析效率
将单细胞测序技术与IT基础设施结合在一起,实现1+1大于2的效果。
阿里云E-HPC+i4p大内存实例,加速寻因生物单细胞数据分析效率
|
存储 监控 并行计算
X86 vs ARM 架构同台竞技: 生物大数据大规模并行计算(如何将WGS全基因组计算成本降到1美元)
Sentieon DNAseq 实施的全基因组测序 (WGS) 二级分析流程与行业标准的 BWA-GATK 最佳实践流程结果相匹配,且运行速度提高了 5-20 倍。 Sentieon软件安装简单,开箱即用,并且提供了与ARM和x86指令集适配的版本。使30X WGS 数据样本在OCI 实例上的计算成本压缩到每个样本 1 美元以下,处理时间缩短到近一小时。
281 0
X86 vs ARM 架构同台竞技: 生物大数据大规模并行计算(如何将WGS全基因组计算成本降到1美元)
|
机器学习/深度学习 存储 人工智能
|
机器学习/深度学习 人工智能 算法
机器学习模型太慢?来看看英特尔(R) 扩展加速 ⛵
机器学习建模过程如何提速?本文提供 Intel 针对 Scikit-Learn 工具库做的加速补丁,是一种硬件层面的解决方案,支持多种算法,并可以将建模时间压缩为常规方式的 1/5
825 1
机器学习模型太慢?来看看英特尔(R) 扩展加速 ⛵
《云上高性能计算助力基因测序:寻因生物案例分享》电子版地址
基因测序的业务流程主要包括样本上机(测序仪)、测序文件生成、基因序列比对及结果分析(计算机),并将结果数据及报告交付至各科研医疗机构。其中,基因序列比对及分析环节极为耗时,涉及大量的生信领域专业软件,计算资源的算力性能及方案优化对生信研发效率起着至关重要的作用。
115 0
《云上高性能计算助力基因测序:寻因生物案例分享》电子版地址
|
弹性计算 编解码 运维
云上高性能计算助力基因测序
本文整理自阿里云行业解决方案架构师马颂(栖逸),在阿里云计算情报局的分享。本篇内容主要分为三个部分: 1. 寻因生物简介 2. 单细胞测序及痛点 3. 寻因生物基于E-HPC的大内存实例解决方案
939 0
云上高性能计算助力基因测序

热门文章

最新文章