人和未来刷新世界纪录 助力生物信息云计算

简介:

2016年11月4日,基因组云计算技术开发者大会(GCTA)在第11届国际基因组学大会(ICG)上正式公布了历时6个月的全球公开竞赛结果。

本届大赛由今年4月份成立的“中国生物信息云计算产业联盟”倡导发起,集聚华大基因、阿里云、英特尔、百度开放云、华为等单位的技术开发力量,通过汇聚BT和IT行业精英,共同解决基因组学数据大规模存储和计算等方面所面临的挑战。

在众多BT和IT行业精英中,人和未来脱颖而出,成为本届大赛最大的黑马。人和未来CTO宋卓博士代表GTX团队领取了奖杯和证书。人和未来在数据压缩和计算加速两个项目上的成绩均刷新了世界纪录,同时保持了最低的计算成本,将全基因组的计算分析带入百元(16$)时代。

此次大赛的竞赛项目分为以下2个:

1、 数据存储问题:FASTQ数据的高倍数无损压缩

将一个原始FASTQ格式的150GBDNA测序数据文件无损压缩至原来的1/15。

2、 分析计算问题:高效的人类全基因数据分析

30分钟完成55x人类全基因组数据标准分析。

这两个选题瞄准的是生物信息云计算中最重要的两个问题——压缩和计算。只有高效的压缩才便于大规模向云端传输数据,降低云端存储成本;只有高效的计算才能充分体现云端弹性计算应有的优势。解决好这两个问题,就能站在技术制高点上,推动生物信息云计算行业的发展。

双料王,人和未来的两项成绩均刷新世界纪录

本次比赛项目的难度和要求都非常高,吸引了全球300多家机构和个人的参赛,诞生了令人惊喜的成绩,首届GCTA风云挑战赛完美收官。两项比赛第一名的最好成绩均由人和未来生物科技 (北京)有限公司获得,性能如下:

  1. 压缩存储:7个测序质量值下,压缩率达到1/18;33个测序质量值下,压缩率达到1/8。

与行业默认标准gzip相比,计算时间为其1/6且压缩后文件大小为其1/4,即压缩效率是gzip性能的24倍。 在这样的极高倍率压缩技术的支持下, 使用百兆网络,就能达到以千兆速度上传数据的效果, 使得大规模测序数据上云成为可能。 此外,若按照AWS云每gb云存储成本0.03美金/月计算。该高倍率压缩技术将能让每1000人的测序数据云存储,每月节省1.1万美金,大幅降低云存储成本。 该技术突破,作为一项重要的基础性工作,为整个行业的基因信息计算上云铺平了道路。

  1. 加速计算:18分钟完成400G 55x人类全基因组分析。

不仅如此,人和未来在计算加速比赛的成绩也刷新了世界记录:400G(55x)全基因组数据分析,利用AWS上的300台机器,将分析时间从单台服务器的30个小时,缩短为18分钟,机时费用仅为$16,将全基因组计算带入百元时代。对比单台标准服务器,数据分析速度提高了90倍,可节约75%的云计算机时费用。

基因测序技术日渐普及,基因检测的核心竞争力已经不仅限于测序产生数据的能力,大数据、高性能计算、机器学习这些IT领域里面的热词和标签会出现在越来越多的基因检测公司身上。BT与IT的结合,相信能实现技术创新,用科技的力量推动和加快精准医疗的发展,对全行业发展具有重大意义。

本文转自d1net(转载)

目录
相关文章
|
10月前
|
弹性计算 运维 自动驾驶
飞天技术峰会:持续释放技术红利
飞天技术峰会:持续释放技术红利
39 0
|
11月前
|
机器学习/深度学习 jstorm 人工智能
带你读《2022龙蜥社区全景白皮书》——6.2.3 龙蜥社区助力阿里数据中心大幅降低成本
带你读《2022龙蜥社区全景白皮书》——6.2.3 龙蜥社区助力阿里数据中心大幅降低成本
118 1
|
弹性计算 Cloud Native 安全
Gartner:云计算持续演进,加速企业上云进程
Gartner预测云计算的门槛将逐渐降低、生态化和差异化将成为主流、企业从上云, 即从传统的平台向云平台的迁移,开始进入“云原生”阶段,而专有云则成为中国市场的独有特色
390 0
|
人工智能 运维 Cloud Native
云上创新时代:云原生加速数字化转型创新,开发者黄金时代即将到来!
2021年5月28日、29日,由阿里云主办的“云上创新开发者大会”在北京成功举行。大会涵盖云计算领域最新热点话题,云原生、云上大数据、AI、低代码、云效敏捷、云钉等专题及开发者分论坛,与数千位开发者一道,共享一场技术盛宴。 云上创新、开发者是会议的关键词,开放、开源成为阿里云产品主流,新的产业变革正向我们走来!
云上创新时代:云原生加速数字化转型创新,开发者黄金时代即将到来!
|
新零售 人工智能 达摩院
新零售赛道明星首次集结,“理论+实战”加速创新企业发展
针对新零售赛道,聚焦技术变革、阿里战略布局,致力于打造新零售赛道未来独角兽。
新零售赛道明星首次集结,“理论+实战”加速创新企业发展
|
人工智能 分布式计算 Kubernetes
云计算模式:2021年的趋势是什么
我们都知道云计算的优势。如果我们谈论未来,那么混合云,无服务器计算和容器等各种云计算趋势将在未来主导整个行业。
|
安全 专有云 数据库
【云栖大会】阿里云李津:持续释放技术红利,为1000万企业提供技术平台
阿里云一直致力于核心技术研发,提升资源利用率,扩大云计算规模效应,打造高性价比的云服务。“我们希望通过不断的技术进步和资源优化,把这些技术红利和所有人分享,降低创新门槛,不断提升社会效率”。
6038 0
|
人工智能 数据挖掘 关系型数据库
云计算周热点回顾:阿里云棒棒哒!
本文讲的是云计算周热点回顾:阿里云棒棒哒!【IT168 资讯】本周云计算领域发生了哪些事儿,让我们一起来回顾一下。本期涉及以下几个厂商(LOGO位置随机摆放…)
2564 0