降低人工智能成本50%阿里云推出新一代异构实例GN5i-阿里云开发者社区

开发者社区> 人工智能> 正文
登录阅读全文

降低人工智能成本50%阿里云推出新一代异构实例GN5i

简介:

9月12日,阿里云正式推出最新一代GPU实例GN5i。这款产品主要适用于深度学习的在线推理(Inference)阶段,可一键部署TensorFlow等主流深度学习框架,提供智能调度、自动运维、实时扩容等服务。人工智能产业用户可通过GN5i搭建微秒级响应的AI服务,在线服务成本减少50%以上。

image


阿里云官网显示,GN5i采用了英伟达Pascal架构P4图形处理器,提供最大45Tops INT8整型计算能力和11TFlops FP32单精度浮点计算能力,在满足数据处理吞吐的基础上,时延最低可达微秒级。支持小时付费,也支持包月包年。
此外,针对自建GPU服务器经常会遇到的扩容难、适配难的问题,GN5i规格族提供了灵活弹性的系列化配置,可以根据深度学习计算力的要求,按需选择合适的规格,分钟级即可完成实例的创建,并可根据运算力需求进行GPU实例的“Scale-out”水平扩容或“Scale-up”垂直变配。
阿里云高级技术专家龙欣介绍,在面向AI深度学习在线推理场景时,GN5i实例能够给客户带来以下价值:
• 稳定的企业级GPU计算能力,保障深度学习推理任务处理效率;
• 全面兼容主流深度学习框架,如TensorFlow、Caffe、MXNet、CNTK等;
• 配备阿里云高性能SSD云存储,加速数据的读取性能;搭配阿里云的OSS存储服务,能达到最佳的存储性价比;
• 在满足数据处理吞吐的基础上,时延最低可达微秒级;
• 推理型专用GPU,大幅降低AI在线服务建设成本;


image

• GN5i的推出进一步丰富了阿里云异构计算家族的产品线。针对模型训练学习,阿里云在今年5月推出了高性能GPU实例GN5,单实例最多可提供8个英伟达 P100 GPU、2万多个并行处理核心,最高75TFLOPS FP32单精度浮点、150 TFLOPS FP16半精度浮点和37 TFLOPS FP64双精度浮点运算能力,每个P100搭配的16GB HBM2 3D堆叠内存提供了高达732GB每秒的数据传输速率,配合GN5i可有效保障深度学习的处理效率。
除了产品层面,阿里云还提供了全方位的人工智能产业服务,包括智能语音交互、图像/视频识别、交通预测、情感分析等技术服务,这些技术正通过阿里云ET对外输出。过去一年,阿里云推出ET城市大脑、ET工业大脑、ET医疗大脑等行业垂直的人工智能系统,为工厂或者医院创造更多利润或者更高的诊断准确率。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
人工智能
使用钉钉扫一扫加入圈子
+ 订阅

了解行业+人工智能最先进的技术和实践,参与行业+人工智能实践项目

其他文章