美国能源部呼吁建立国家微生物组数据中心

简介:

微生物基因组研究已经进行了30多年,同时我们也进入了信息时代,建立国家微生物组数据中心能够为了解地球上的微生物铺平道路。

海量数据需要一种基础结构方式来进行管理和存储信息,让这些数据能够更加容易获取和使用。目前的技术已经能够让研究人员在一定环境下对微生物群落进行测序和注释,随着数据量的不断增加,数据管理方面的技术并没有实现并行开发。

2016年5月16日发表在《微生物趋势》(Trends in Microbiology)网络版的一篇论文中,美国能源部联合基因研究所(DOE JGI),美国能源部下辖的科学使用者设施办公室,呼吁建立国家微生物组数据中心,有效管理全球范围内积累的数据集,通过整合和利用所有可用的微生物组数据和元数据,研究人员能进行大规模的比较分析,以应对能源,环境,卫生和农业方面的全球性挑战。

“现在时机已经成熟,需要我们尽最大努力着手了解地球的微生物组,” DOE JGI 原核生物超级计划项目主任,也是这篇论文的第一作者Nikos Kyrpides说。“生物序列数据是用于研究生物学系统的一种工具,类似于天文学中的天文望远镜和高能物理学中的粒子加速器。”

国家微生物组计划的补充

建立数据中心及时发布数据,补充了白宫推出的全国微生物组计划,这项计划的重点是在整个生态系统中,比较微生物群落,并用来确定划分各种微生物的“组织原则”。该团队认为,国家微生物组数据中心应当“编组、加工、提供一切可用的环境基因组数据。”

Kyrpides和他的同事发现了三个微生物研究短视行为的瓶颈问题:缺乏广阔的视野,超越单一用途的生物组数据集,建立规模更大的数据集;缺乏跨部门的资助模式;以及缺乏国际数据标准,这阻碍了全球学术界从事有效比较分析的能力。目前国际上存在几个大型数据管理系统,包括综合微生物基因组(IMG)系统和DOE JGI科学家们管理的基因组在线数据库系统(GOLD)。这些资源让研究人员能够分别地访问和分析公开的微生物和微生物组数据和元数据。此外,DOE JGI已与美国能源部研究科学计算中心(NERSC)合作,在高性能计算环境下操作,支持日益增长的社会需求。

微生物研究尺度的一个宏伟愿景

“在利用适当的资金资助从大数据中提取知识如(跨学科研究)的研究方面,目前严重缺乏宏观的目标,” Kyrpides说。“此外,需要置于各类生物组样本研究中的参考数据严重缺乏。这些数据是解释微生物组功能和它们如何与环境和宿主之间相互作用的根本。对微生物和它们所处环境的系统解码填补了我们数据库中的一项空白,这是朝着假设驱动的科学和更好地了解微生物生命的关键一步。”

美国能源部有承担大项目的传统,从首个粒子加速器到它在启动人类基因组计划中的作用,DOE JGI对微生物研究并不陌生,他们在2004年报告了首个微生物群落的基因组特征。在过去10年里,微生物研究已经形成规模,攻关项目包括白蚁肠道微生物,奶牛瘤胃,墨西哥湾食油微生物组,草原土壤和永久冻土。通过社会科学项目与DOE JGI.合作开发了最大的数据集,它关注最小氧浓度区,被形容为“唯一系统地、定量地开发可用数据库”用于研究病毒生态群落。

“微生物基因组研究已经进行了30多年,同时我们也进入了信息时代,建立国家微生物组数据中心能够为了解地球上的微生物铺平道路,” Kyrpides说。

本文转自d1net(转载)

相关文章
卡塔尔内阁批准微软在该国建立全球数据中心
为了抢先赢得第三世界国家的市场,微软不得不加快步伐。
519 0
|
存储 Ubuntu 应用服务中间件
Kubernetes建立数据中心级apt镜像站点
对于企业级开发团队,搭建软件包的镜像站点(以及Docker Images Registry镜像站点)是减少网络带宽占用、加速软件开发过程的必备措施。 本文持续更新,地址 https://my.oschina.net/u/2306127/blog/2032372 本文代码仓库,请按照自己的资源配置参数进行修改使用。
1281 0