阿里云资深技术专家,阿里云弹性高性能计算产品线负责人,研发了业界首个统一TensorFlow,PyTorch,MXNet,Caffe的神龙AI加速引擎,获得AI性能权威榜单DawnBench训练、推理的性能、成本的4项世界第一。
产品介绍: 超级计算集群(SCC),面向高性能计算、人工智能/深度学习、科学/工程计算、数据分析、音视频处理,提供极致计算性能和并行效率、高速RDMA网络互联、弹性、安全的CPU和异构(GPU 等加速设备)计算集群服务。
内容: 阿里云弹性人工智能服务是基于阿里云弹性基础资源,为用户提供极致性能优化的、一站式的、开源开放的人工智能解决方案。 在LC3会议上我们介绍了我们极致加速人工智能应用性能; 介绍了集团内的应用优化,其中OCR识别的性能提升到原来的2.
随着人工智能浪潮的兴起,人工智能基础芯片作为主要的计算力推动引擎也越来越受到追捧和热议,这个系列连载会介绍人工智能芯片兴起的背景和现有主要玩家以及研究现状,主要包括NVidia GPU、Google的TPU、Intel的Nervana、IBM的TreueNorth、微软的DPU和BrainWave、百度的XPU、Xilinx的xDNN、寒武纪芯片、地平线以及深鉴科技的AI芯片等。
Tensorflow是目前使用最为广泛的深度学习框架之一,但是目前搭建分布式多机多卡训练比较困难,而且Tensorflow原生的分布式的性能很差。为了解决这个问题,我们创建了一个容器镜像:registry.
产品介绍: 弹性高性能计算(E-HPC)基于阿里云基础设施,为用户提供一站式公共云HPC服务,面向教育科研、企事业单位和个人提供快捷、弹性、安全和与阿里云产品互通的技术计算云平台。产品功能及优势: 功能1. 一键创建ECS/EGS集群,自动部署HPC全套软件栈,包括资源调度器、域账号管理和一些常用的HPC高性能库和开源软件,包括MPI、HPL、NPB、WRF、Gromacs、Lamps、OpenFOAM等。