微软拟用DNA存储数据:一段就能顶一个数据中心

简介:

5月24日消息,据Technologyreview报道,微软公司旗下研究院的研究人员表示,在早期利用NDA存储电影和文档的研究基础上,该公司正在研发利用生物学取代磁带驱动器的存储装置。

微软研究院的计算机架构师表示,该公司已经正式制定了一个目标,即在2020年之前,在数据中心内建立一个以DNA为基础的操作存储系统。微软研究院架构师道格·卡米(Doug Carmean)说:“我们希望3年内实现这样的愿景,即在原始商业系统中的DNA上存储相当于1个数据中心的数据量。”卡米还描述了最终设备的大小,它与20世纪70年代的施乐复印机差不多。在内部,微软怀有更宏伟的目标,即利用生物学取代磁带驱动器,这是一种用于归档信息的通用格式。卡米说:“我们希望把它命名为‘DNA存储'。”

这些计划表明,许多科技公司正严肃地对待这个看似奇怪的想法,希望将视频、照片或有价值的文档保存在基因构成的分子中。Semiconductor Research Corporation首席科学家维克多·日尔诺夫(Victor Zhirnov)表示,努力增加计算机内存依然存在物理极限,而DNA却拥有令人难以置信的密度,可用其存储数据。

在DNA中,每部电影都被压缩到比方糖更小的体积。日尔诺夫说:“DNA是宇宙中已知最密度最高的存储介质,这就是为什么人们会看重这种研究潜力的原因,我们正在解决存储信息呈现指数增长的问题。”去年七月份,微软公开宣称它在DNA链中储存了200兆字节的数据,其中包括一段音乐视频,创下了新的记录。卡米与微软研究院专家卡琳·斯特劳斯(Karin Strauss)、华盛顿大学计算机实验室科学家路易斯·塞泽(Luis Ceze)在预印服务器BioRxiv上发表论文,介绍了他们取得的进展。

利用DNA存储数据的主要障碍仍然存在,将数字位转换成DNA编码(由A、G、C和T组成的核苷酸链)仍然费力而昂贵,因为制造DNA链需要漫长的化学过程。在其示范项目中,微软使用了13448372个独特的DNA片段。专家表示,在公开市场上购买这些材料要花80万美元。哥伦比亚大学研究DNA存储方法的教授雅尼弗·埃里奇(Yaniv Erlich)说:“用DNA存储数据的主要问题是成本高昂,因此微软方案最重要的地方是其是否能解决这个问题”。在阅读卡米等人的论文后,埃里奇说:“我没有看到帮助实现这个目标的任何进展,但也许他们还有更多新东西。”

微软表示,DNA存储成本需要下降10000倍后才可能被广泛采用。虽然许多专家认为这是不可能的,但微软坚信这种进步可能会发生,前提是计算机行业需要它。将数字数据写入DNA的过程自动化也是至关重要的。根据数周的实验显示,卡米估计向DNA中转存数据的速率是每秒400字节。微软表示,这个速度需要增加到每秒100兆字节。

读取数据变得越来越容易,通过使用高速测序机就可实现,包括召回文件的特定部分,类似于计算机上的随机存取存储器。微软认为,如果DNA阅读获得两倍改进,就能促使该系统的效率满足商业用途。由于写入和检索数据到DNA中非常缓慢,任何早期使用的技术将仅限于特殊情况。这可能是因为需要存档的数据存在法律或监管原因,如警察机构的CAM视频或医疗记录。

微软目前正与位于旧金山的DNA制造商Twist Bioscience合作,后者是新成立的公司,致力于提高DNA产量。除Twist Bioscience之外,其他类似公司还包括DNAScript、Nuclera Nucleics、Evonetix、Molecular Assemblies、Catalog DNA、Helixworks以及从Oxford Nanopore剥离出来的Genome Foundry。

有些初创公司正追求令人兴奋的愿景,即用一种使用酶的DNA代替40年的化学反应过程,就像我们自己的身体那样。Technicolor Research的科学主管让·伯洛特(Jean Bolot)说:“我相信今年会看到结果。”他的公司始终在与电影公司讨论如何用DNA存储。他说,1951年之前的半数电影因为存储在电影胶片上而丢失。现在有了新的格式,如高清视频和虚拟现实,正在扩大工作室保存这些作品的能力。

日尔诺夫表示,计算机芯片制造商非常看重DNA存储技术,因为传统媒介(如磁带或硬盘)存储数据总是存在物理限制。日尔诺夫所在的机构由微软、英特尔以及其他机构资助,他们正进行应用研究,并从2013开始开始瞄准DNA。他说,认为DNA太“软”的半导体专家们惊讶地发现,它比硅器件长100到1000倍。这种分子非常稳定,经常可以从猛犸象骨头和远古人类遗骸中提取到。

但其最重要的特征是高密度性。DNA可以在1立方毫米的片段上容纳100亿亿字节信息。日尔诺夫说“密度才是最重要的”。微软研究院发言人表示,该公司目前无法确认“产品计划的具体细节”。在公司内部,DNA存储的想法显然得到许多人支持,但尚未被普遍接受。卡米说:“我们内部的人相信我们,但支持磁带存储的人还存在怀疑。”

除了质密耐用外,DNA存储还有其他不被经常提到优势,即与人类物种的极端相关性。想想那些你已经无法读取的旧软盘或难以辨认出象形文字的粘土片。与这些媒介不同的是,DNA永远不会过时。卡米表示:“只要我们依然是人类,我们永远都能读取DNA。”

本文转自d1net(转载)

相关文章
|
10月前
|
人工智能 安全 数据中心
D1net阅闻 | 微软CEO对话特朗普和马斯克:豪掷800亿美元建AI数据中心
D1net阅闻 | 微软CEO对话特朗普和马斯克:豪掷800亿美元建AI数据中心
|
存储 数据采集 安全
什么是数据管理,数据治理,数据中心,数据中台,数据湖?
什么是数据管理,数据治理,数据中心,数据中台,数据湖?
663 0
|
机器学习/深度学习 监控 搜索推荐
oushudb丨数据中心转型利润中心:数据如何赋能零售行业营销升级?
oushudb丨数据中心转型利润中心:数据如何赋能零售行业营销升级?
220 0
|
存储 人工智能 运维
数据中心的下一步,万国数据探索全新合作伙伴生态战略
数据中心的下一步,万国数据探索全新合作伙伴生态战略
747 0
数据中心的下一步,万国数据探索全新合作伙伴生态战略
|
Rust 安全 网络安全
损失惨重!数据中心失火,360 万个网站下线,Rust 游戏 25 台服务器数据永久丢失
数据中心失火,360 万个网站被迫下线,一些企业甚至还没有灾难恢复计划,这是被一锅端了?
375 0
损失惨重!数据中心失火,360 万个网站下线,Rust 游戏 25 台服务器数据永久丢失
|
存储 测试技术 数据中心
微软首次推出便携式数据中心,将云计算带到远程环境
微软首次推出便携式数据中心,将云计算带到远程环境
微软首次推出便携式数据中心,将云计算带到远程环境
|
分布式计算 数据中心 混合部署
Alibaba Cluster Data 开源:270GB 数据揭秘你不知道的阿里巴巴数据中心
打开一篇篇 IT 技术文章,你总能够看到“大规模”、“海量请求”这些字眼。如今,这些功能强大的互联网应用,都运行在大规模数据中心上,然而,对于大规模数据中心,你又了解多少呢?实际上,除了阅读一些科技文章之外,你很难得到更多关于数据中心的信息。
6317 0
卡塔尔内阁批准微软在该国建立全球数据中心
为了抢先赢得第三世界国家的市场,微软不得不加快步伐。
627 0
|
存储 数据中心
传统数据中心地位不保,2021年数据存储量被云超越
据知名研究机构IDC预测,2021年全球存储在公共云上的数据量将超过传统数据中心,传统数据中心自上世纪60年代起对企业数据的把持将被云打破,企业进入All in Cloud时代。
2131 0
|
新零售 分布式计算 数据中心
Alibaba Cluster Data 开放下载:270 GB 数据揭秘你不知道的阿里巴巴数据中心
打开一篇篇 IT 技术文章,你总能够看到“大规模”、“海量请求”这些字眼。如今,这些功能强大的互联网应用,都运行在大规模数据中心上。然而,对于大规模数据中心,你又了解多少呢?实际上,除了阅读一些科技文章之外,得到关于数据中心的信息非常难得。
3814 0