自主芯片+国产系统!天河三号原型机研制完成,中国超算有望重回No.1

简介: 国超级计算机又有新突破!经过两年多的持续关键技术攻关和突破,“天河三号”E级原型机研制部署完成,并于7月22日通过科技部验收。

我国超级计算机又有新突破!

经过两年多的持续关键技术攻关和突破,“天河三号”E级原型机研制部署完成,并于7月22日通过科技部验收。

“天河三号”原型机,全面搭载国产自主芯片,不再使用英特尔处理器。而且相关的操作系统、并行开发等系统也为自主研发。

由此,中国E级计算机将很快进入实质性研发阶段。

按计划,“天河三号”超级计算机有望于2020年研制成功,其运算能力将比“天河一号”提高200倍,存储容量提高100倍。

今年6月,中国丢掉蝉联多次的全球超算冠军宝座,美国超算时隔多年重返榜首。而“天河三号”有望在两年内,夺回这一殊荣。

自主突破

“天河三号”E级原型机,由国防科技大学和国家超级计算天津中心等团队合作研发,并部署在国家超级计算天津中心。

2016年,科技部结合“十三五”发展规划,分两期启动我国E级计算机研制计划。第一期主要为E级计算机关键技术研究,安排了三个E级机原型样机的研制;第二期为研制E级计算机。

其中,“天河三号E级原型机系统”经过两年多的关键技术攻关和突破,成为我国首个完成原型样机系统研制和部署的项目。

公开信息显示,“天河三号”E级原型机实现四大自主创新:

三款自主芯片:“迈创”众核处理器(Matrix-2000+)、互连接口芯片、路由器芯片;

四类计算、存储和服务结点,十余种PCB电路板;

新型的计算处理、高速互连、并行存储、服务处理、监控诊断、基础架构等硬件分系统;

系统操作、并行开发、应用支撑和综合管理等软件分系统。

在技术创新的基础上,“天河三号原型机系统”实现了可适应科学计算和数据处理多应用需求的柔性体系结构,突破了计算、访存、通信三方平衡的高性能计算结点技术。

可支持十万结点规模的高速互连和光电混合高速信号传输技术,高效靶向散热冷却技术,用户透明的高性能计算环境软件支撑等技术。


image

据科技日报报道,“天河”系列超级计算机,在核心关键技术上已实现了整体自主可控。

目前,通用CPU和加速器CPU、互连通信路由芯片和互连接口芯片,均已装配在“天河二号”2期系统中,打破了2015年美国对国防科大和“天河”系超算中心的CPU禁运.

而“天河三号”超级计算机将对这四大芯片进行全面升级。

这还不够,未来“天河三号”E级超级计算机将对已经设计生产的三款计算、互联通信核心芯片再进行全面升级。

同时基于飞腾CPU设计新的多核CPU,实现可支持海量数据存储的层次式存储系统,对适用高性能计算和高效大数据处理的柔性体系结构进一步优化,最终制造出新一代“天河三号”E级超级计算机。

E级超算

所谓E级计算机,是指每秒可进行百亿亿次数学运算的超级计算机,被称为“超级计算机界的下一顶皇冠”。

目前全球最快的超级计算机,峰值运算速度都在每秒十亿亿次级别。

E级计算机有什么用?可以参考国家超级计算天津中心相关负责人的下面这段公开表述:

今后将依托“天河三号”超级计算机,构建超级计算与云计算和大数据深度融合的高性能计算服务平台,在长效高分辨率气候气象预报、大规模航空航天数值风洞、地震地质研究和油气能源勘探、生命科学研究等超大规模计算与模拟,以及涉及国计民生、信息安全的政务数据、医疗卫生、基因健康、智慧城市、交通、地理、海洋等大数据分析处理领域,发挥强大支撑和平台作用,有效推动新一代人工智能发展规划等实施和网络强国建设。

前面我们提到,中国的E级超算原型样机有三台。

除了天河,还有神威、曙光两家。

神威E级原型机由江南计算技术研究所承研,此前已经通过“预验收”。据《济南时报》7月20日报道,神威E级原型机已经抵达济南,开始在国家超级计算济南中心开始组装调试。

预计在7月26日前后将全部安装调试完毕,进入试运行状态。

image

神威E级原型机,也是我国完全自主研发的E级计算机原型机,具有完全自主知识产权。

“我们花了6000万,构建了神威E级原型机,它的运行速度是3-4个P(1P=1千万亿次)。”国家超算济南中心副主任潘景山透露,“E级计算机+E级存储,总投入在40亿左右。”

这么大的投入,为尽量避免失败,所以才有3台原型机进行验证。

现在看起来,天河和神威的速度比较接近,这两台E级超算的原型机,在进度上相差无几,基本处于你追我赶的节奏。

至于曙光的E级原型机,目前公开信息较少。

去年7月,中科曙光宣布由其牵头的E级高性能计算机原型系统项目正式发布。

目前没有看到有更多的进展披露,有分析人士猜测,曙光E级原型机,采用的方案可能是“AMD CPU国产化版本+GPU国产化版本”。

超算竞赛

今年6月25日,新一期超级计算机TOP500榜单发布。

时隔五年,美国超级计算机Summit(顶点)终于超越中国超算“神威·太湖之光”,重回排行榜第一。

Summit由IBM公司负责制造,搭载了27648块英伟达Volta GV100,这些GPU提供了超过95%的计算力;此外还有103752颗IBM Power9处理器。

这台超级计算机占地面积相当于2个网球场大小,重量相当于一架商业喷气机。

美国为了研发这台超算,也是经过多年谋划。为了争夺第一,Summit的发布时间还提前了半年。

image

此次榜单发布之前,中国的“天河二号”和“神威·太湖之光”两台超算,已经接力连续五年稳居超算TOP500冠军宝座。

2015年,“天河二号”在系统升级方面遇到了麻烦:美国商务部针对中国,实行了英特尔“至强”(XEON)芯片的禁运政策。

对于突然实行至强芯片禁运的原因,美国方面给出的解释是这4家中国超算中心从事“违反”美国国家安全或外交政策利益的活动。

而这件事,也促成了国产芯片的发展。中国很快研发出了自主众核加速器。

其实,2002年之前TOP500榜单没有任何中国超算的身影。但此后的十五年里,中国超算突飞猛进,从一穷二白一跃成为世界第一。

目前TOP500中,中国超算总量还是世界第一。

但近期想撼动Summit的冠军位置,是一个几乎不可能的事情。如果一切顺利,2020年前后,“天河三号”等新一代超算,应该会帮助中国超算重新夺冠。

期待。

原文发布时间为:2018-07-27
本文来自云栖社区合作伙伴“量子位”,了解相关信息可以关注“量子位”。

相关文章
|
存储 传感器 机器学习/深度学习
阿里平头哥首颗芯片玄铁910问世,联合四张「王牌」迎接云计算拐点
「2019 年将会是云计算市场的重要拐点」,阿里巴巴集团 CTO、阿里云智能总裁张建锋以「拐点」拉开阿里云峰会上海站的序幕。
399 0
阿里平头哥首颗芯片玄铁910问世,联合四张「王牌」迎接云计算拐点
|
机器学习/深度学习 城市大脑 人工智能
人狠话不多!阿里成立半导体公司「平头哥」:首款 AI 芯片明年面世
9 月 19 日上午,由杭州市政府与阿里巴巴主办、最具影响力的云计算峰会——「云栖大会」在杭州开幕。大会首日,阿里巴巴发布了城市大脑 2.0 版,宣布成立「平头哥」半导体公司开发 AI 芯片,吸引了众人关注。
845 0
人狠话不多!阿里成立半导体公司「平头哥」:首款 AI 芯片明年面世
|
人工智能
民营卫星公司“国星宇航”完成数千万元天使轮融资,自主研发AI星载操作系统
国星宇航相关负责人表示,“国星宇航致力于推动我国卫星数据产业的智能化、商业化及军民融合化。立志成为宇航时代的影像数据入口,用航天遥感技术赋能人类发展,让全球地面变化可感知、可追溯、可利用、可共享。”
429 0
|
人工智能 芯片 AI芯片
【中国缺芯之痛】国产芯占有率多项为0,为什么中国人设计不出好芯片?
美国制裁中兴,背后折射的是中国集成电路行业的问题:中国有着全球最大的半导体市场,但集成电路设计企业的主流产品仍然集中在中低端。基础能力上的欠缺,强烈依赖第三方的先进IP核、先进工艺和外包设计服务,最终行业将受制于人。
2227 0