最近几年,在大数据和人工智能的推动下,异构计算有了长足的发展。无论是在产品形态上,还是在应用领域上,阿里云异构计算都取得了累累硕果。
3月29日上午,深圳云栖大会,阿里云高级产品专家潘岳,针对这种时代下的阿里云异构计算做了一场深度的剖析。
在现场潘岳介绍到,阿里云异构计算产品提供了丰富的“面向多场景的异构计算加速平台”,这其中包括了专门针对图形图像渲染的GA1实例(AMD S7150),为满足人工智能训练推理需求的GN5(P100)实例,适合人工智能推理和视频转码应用的GN5i(P4)实例,以及为了解决人工智能、高性能计算领域更高计算力需求的GN6(V100)实例,也提供多种FPGA实例以服务图像转码、基因计算、数据库加速等业务。
这些平台中,GN6实例专门为深度学习训练,和高性能计算领域的应用而生,选用了最新的Nvidia Volta架构的Tesla V100,相比于前一代P100产品,GN6实例提供高达12倍的计算性能,能够很好的帮助工程师和科学家们,解决之前无法应对的难题,目前GN6(V100)正处于公测阶段,近期上线敬请期待。
在整个异构产品定义中,阿里云一直本着严谨专业的态度,在提到Pascal这代GPU的选择问题,相信很多人会因为手册上的单精浮点能力选择P40,因为P40具备12TFlops的能力,而P100只有10.6TFlops。但经过阿里云研发团队多种场景,多种方式的实测下来,在人工智能应用中,P100的性能要高出20%。以下为两个场景的测试结果:
在本次深圳云栖大会主论坛,阿里云在GPU生态的建设上同Nvidia展开深度合作,包括之前的Nvidia深度学习研究院DLI在阿里云大学的落地和普及,也包括为服务人工智能行业而发布的新功能——NGC容器镜像:
NGC是NVIDIA开发的一套深度学习生态系统,可以帮助开发人员免费访问深度学习软件堆栈,建立适合深度学习的开发环境。开发者可在阿里云云市场上获取众多NGC的软件,包括Caffe,、Caffe2、CNTK、MXNet、TensorFlow、Theano、Torch等框架。
而在异构计算领域,FPGA从专用计算领域,走入大众的视野,在通用计算行业崭露头角,也就是近期的事情。目前阿里云FPGA异构计算服务(FPGA as a Service),支持主流FPGA平台,做到平台化,系统化,统一接口,在符合云安全的前提下提供计算力的输出。提供完整的云上开发环境,让更多的FPGA工程师可以方便地在云上开发。并在逐步建立和完善FPGA生态,结合合作伙伴和阿里巴巴的能力,让FPGA优秀的计算能力服务更多客户。目前图片转码压缩,数据库加速,基因计算等领域,都有阿里云FPGA异构平台的身影。
阿里云弹性计算异构平台,在以安全,稳定为基石的前提下,不断提供优质产品和服务,助力企业实现科技创新,让计算和人工智能真正成为普惠科技!