9月20日上午,杭州云栖小镇E1-2会场,备受业界关注的2018年杭州云栖大会异构计算专场召开。
近年来,人工智能持续爆发,对算力提出了更高的要求。异构计算作为大计算时代的解决方案,意在打破传统通用计算的限制,融合不同指令集和体系架构的计算单元,完美支持大计算场景。
让每一个芯片都发挥最大效能
首先,阿里云弹性计算负责人,阿里云研究员余锋,带来了精彩的开场。余锋以摄影来打开话题:每一个镜头都会有特别的定位,在某个场景下合适但是另外场景会力不从心,异构计算的精髓也是如此,即让每一个芯片都发挥最大效能,扬长避短。
余锋说:异构计算带来的计算效率提升是指数级的,但是需要有配套工具,基础设施等等。阿里云正在逐渐让这个门槛变低,并且和业内一起构建技术生态,让异构计算普惠行业,帮助合作伙伴和客户不断创新。
GN6实例 F3实例全面商业化
议题阶段,首先登场的是阿里云高级产品专家潘岳。潘岳首先介绍了正在全面商业化推进的GN6实例和F3实例。GN6实例搭载NVIDIA Volta架构的Tesla V100计算卡,相对于上一代产品可以提供12倍的运算能力提升。而基于阿里云FaaS(FPGA as a service)舜天平台的F3实例搭载Xilinx 16nm Virtex UltraScale+器件VU9P,对比上一代产品,逻辑容量增加4倍,DSP能力提升8倍。
两大平台:昊天 和 舜天,全面助力企业创新
随后,潘岳首次揭秘了阿里云异构计算两大平台:昊天EGS平台和舜天FaaS平台;分别对应异构计算领域两大热门芯片方案:GPU和FPGA。潘岳指出,阿里云异构计算平台技术在阿里巴巴内部已经完成和多项业务的顺利融合,历经大范围高压测试,已然非常成熟。除此之外,异构计算全系产品与阿里云生态深度无缝融合,可以和传统的通用计算共用云上的全套服务。
在改善用户使用体验上,阿里云异构产品持续提供多种工具,来让异构产品更易用,这其中包括了方便开发部署的容器镜像工具,实时监测GPU状态的运维工具,以及神经网络框架优化的增值服务等。此后,潘岳分享了阿里云FPGA云服务器落地的业务场景。最后,在异构生态建设上,潘岳强调,阿里云积极引入国内外众多的解决方案供应商,共同构建完善异构生态体系,为企业客户提供高性能的加速解决方案。
昊天平台揭秘
论坛的第二个议题由阿里云资深技术专家龙欣带来,对昊天EGS平台进行了详细的剖析。龙欣指出阿里云异构计算的GPU云服务,在算力水平扩展趋势背景下,已经从GPU加速器的单点突破,向全面的平台体系演进。
今天的演讲第一次披露了阿里云昊天EGS平台的服务体系:昊天平台在集群计算上,为不同规模的客户提供了从GPU集群运维监控,到底层CUDA驱动,再到中间框架加速层快速一键部署,和GPU集群分布式业务层定制化调优的全面专业服务。演讲还分享了昊天平台在底层基础设施层的技术架构:GPU虚拟机的热升级技术、与AMD联合开发的公共云首个基于SRIOV的GPU热迁移技术、神龙GPU技术与超级计算GPU集群技术。
成熟客户案例立体呈现
来自微博的资深技术专家黄波,从客户的角度,详细介绍了基于阿里云异构计算平台的深度学习案例。同时,黄波先生还从自身体验出发,总结了云端深度学习的优势:弹性,集群化管理,高性能,和专业服务等等。
舜天平台揭秘
第四个登场的是阿里云资深技术专家张振祥,带来了对阿里云FaaS舜天平台的详细剖析。议题指出阿里云FaaS舜天平台是云上输出FPGA高性价比算力的使能器,大幅降低了FPGA的应用门槛。围绕着“易用性、稳定性、可扩展性和安全性”的设计理念,舜天平台做了大量的软硬件创新。
张振祥强调,以舜天平台为依托,阿里云愿与业界的合作伙伴和客户并肩携手,打造FPGA异构计算的健康而强大的生态圈。随着云计算和人工智能的进一步普及,FPGA的器件和技术将获得进一步的提升和改善,更好地适用大算力的应用场景,服务更多的垂直市场。演讲过程中,现场反应热烈,业界同仁对共建生态圈体感强烈。
舜天平台助力阿里高性能时序数据库
最后,阿里巴巴技术专家钱赟介绍了基于阿里云舜天平台的高性能时序数据库。从实际案例出发,再次验证了舜天平台的性能极致,资源易用,IP安全,同时又可以大幅降低计算成本等特性。
阿里云在异构计算上的逐步深入和成熟,正在帮助越来越多的企业在云上实现创新和突破。比如刚刚在MS COCO大赛获得4项世界冠军的旷视科技就是阿里云异构计算的深度用户。客户的成功一直是阿里云的诉求和共同目标,一起来用异构计算开启大计算时代吧。
相关阅读
【杭州云栖】弹性计算平台技术:云服务器“安全”“稳定”“弹性”的基石
AI技术出海 - 阿里云GPU服务器助力旷视勇夺4项世界第一
FPGA资源平民化的新晋- F3 技术解析
【FPGA-F3】阿里云FAAS平台,极大简化FPGA开发部署流程
扫盲人工智能的计算力基石--异构计算