深度学习提速280%!阿里云性能怪兽GN6 V100 GPU实例深度测试

简介: 在 GTC 2017 大会上,NVIDIA 的 CEO 黄仁勋正式发布了其新一代旗舰计算卡 Tesla V100,但是一项技术从发布到真正使用到生产环境中,仍需要大量的时间。V100 何时才能够被广大消费者接触到呢?阿里云首先交出了自己的答卷。

高性价比深度学习神器!阿里云GPU实例V100 最深度评测

在 GTC 2017 大会上,NVIDIA 的 CEO 黄仁勋正式发布了其新一代旗舰计算卡 Tesla V100,但是一项技术从发布到真正使用到生产环境中,仍需要大量的时间。V100 何时才能够被广大消费者接触到呢?阿里云首先交出了自己的答卷。

近期,国内云计算一哥阿里云开启了新一代高性能 GPU 计算云服务器 GN6 系列的公测,也是国内运营商中首个提供最新 NVIDIA V100 GPU 的云服务提供商。

8345939ca2f952dfd6440a24f058a20cbb5538eb

GPU 云服务器 V100

据悉,新的计算实例搭载最新的 NVIDIA V100 计算核心,宣称可带来数倍的深度学习性能提升。究竟搭载英伟达V100的阿里云GPU实例有几把刷子,我们申请了一台最新的GN6系列云服务器,进行了深度测试,一起来看下。

人工智能市场爆发 GPU云服务器成香饽饽

66773c6a849306b24f437d78f813bd9a10408162
国内云厂商上线实例列表

随着人工智能的发展,基于 GPU 的异构计算开始不断升温。特别是传统的 CPU 通用计算由于受到半导体工艺、存储带宽瓶颈等问题,开始在人工智能的运算中显露疲态。而 GPU 由于省去了 CPU 中复杂的控制流,可以将所有算力都投入到深度学习所需要的矢量运算中去,大大提高了算力和算力利用率。

除了性能之外,带来的更多的还是成本的降低。按照传统方案,云服务商可以采购4个机架、共160个CPU服务器,在功耗65千瓦的情况下提供每秒45000张照片的处理能力。而如果换成GPU的产品,你可能只需要一个装有8片GPU的服务器,同样的每秒45000张照片处理能力,但是你只需要7个服务器插槽,总共的功耗也只有3千瓦。

c8df7f3729b2be8d4ca72d22ad0f875579252652

阿里云人工智能布局

在公测期间,用户可以登陆阿里云平台提交测试申请,提交申请的用户会拿到阿里云异构计算平台提供的 GN6 云服务器,进行业务和平台验证。如果你像我一样,忍受不了长时间的计算,那么GN6系列可能是在目前所有的选择中最合适的那一款。

得益于搭载的 NVIDIA V100 GPU 拥有的新的 VOLTA 架构及新增的 Tensor 单元等因素,GN6 云服务器相比前代 GN5 云服务器拥有更加强劲的性能,能够以更少的时间花费来完成计算。

从P100到V100 性能提升近300%

4e7ce3486d838bd5502c296217e2cb5bcd5cea34

 V100 P100 性能对比

我们也通过申请拿到了一台 GN6 云服务器( 实例 ID ecs.gn6p-c8g1.2xlarge,8 vCPU ,32GB 内存)来测试,同时我们还购买了几个同配置的其他机型,来进行对比测试,具体的测试结果如下:

使用 MXNet 框架,测试 Inception-V3 网络在 ImageNet 数据集的图像分类训练的 Benchmark 性能

 6fcc262f95f82c2be27bd26017329c5108967bb0

MXnet 对比结果

使用 NVCaffe 框架,测试 GoogLeNet 网络在 ImagNet 数据集的图像分类训练性能
71ecbdcb485c6cb0cfea31d94244a9935e3b4ced

目前来说,社区的框架还没有更新到能够完全利用 TensorCore 的水平,所以性能无法达到在发布会上声称的十数倍的提升,不过即使是在这种情况下,我们测试到的结果依然表现不俗,性能相比于前代 GN5 云服务器提升了接近 3 倍。同样工作量的训练任务工作时间将压缩过半。

随着后续机器学习框架不断升级优化,TensorCore 的性能将得到全面发挥,将会给机器学习带来再一次大幅度提速。

姗姗来迟的基础镜像 云服务器开箱即用

一直以来,我们购买 GPU 云服务器后,都需要花费大量的时间来进行基础环境的配置、安装 NVIDIA 的驱动。在此处更新中,阿里云还上线了新的基础镜像,新的基础镜像预装了 NVIDIA GPU 驱动和深度学习框架的系统镜像,我们在云服务器启动随即可以准备开始进行深度学习的计算,大大节省了环境配置的时间,减少重复工作,GPU 云服务器也终于做到了开箱即用。

创建云服务器时,开发者可以直接在选择镜像时在镜像市场搜索“深度学习”,就可以找到预装深度学习框架的系统镜像,点击使用就可以直接创建开箱即用的 GPU 云服务器。

d2f11acb6874df611adf6d5e5b38e7eec84ca7bc

 

我们在使用 GPU 云服务器进行深度学习所需要的准备时间从原来的数个小时缩短到了不到五分钟,确确实实节省了大量的工作时间。

总结

就目前人工智能而言,已然进入战国时代,而且各家的产品都有可能在这个广阔的市场中找到自己的定位和细分市场,从跑分来看,阿里云的 GN6系列云服务器是市面上性能最强的GPU云服务器,,没有之一。在易用性上,一键部署、镜像市场等服务都有不俗的表现。

在价格方面,阿里云GN6相比同类的V100服务器要低上不少,让我们看到了作为云计算领军者的诚意。同时我们也相信未来会有更多的云厂商推出类似的服务,让整个人工智能市场拥有强大的计算能力。


 转自:https://mparticle.uc.cn/article.html?spm=a2s0i.db_contents.content.10.223acc71aV9IZJ&uc_param_str=frdnsnpfvecpntnwprdssskt&wm_id=c9c44564ca234df0be219e38392383ae&wm_aid=05c612bc356a4e649bfe6ed6e7d591b9

 

相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
目录
相关文章
|
25天前
|
存储 并行计算 调度
迈向可编程观测:在GPU Kernel中构建类eBPF风格的性能探针
本文旨在梳理作者学习路径,带领读者共同探索 GPU Kernel 性能分析从宏观到微观的技术演进。
376 24
迈向可编程观测:在GPU Kernel中构建类eBPF风格的性能探针
|
2月前
|
存储 机器学习/深度学习 人工智能
GPU云存储性能:加速AI与高性能计算的关键
在人工智能(AI)、机器学习(ML)和高性能计算(HPC)飞速发展的今天,数据存储和处理的效率已成为决定项目成败的关键因素。传统的云存储方案往往无法满足GPU密集型工作负载的需求,而GPU云存储性能的优化正成为企业提升计算效率、降低延迟的核心突破口。本文将深入探讨GPU云存储性能的重要性、关键技术及优化策略,助您在数据驱动的竞争中占据先机。
|
5月前
|
机器学习/深度学习 存储 人工智能
阿里云GPU服务器gn6v、gn7i、gn6i性能特点、区别及选择参考
阿里云GPU云服务器产品线凭借其强大的计算能力和广泛的应用价值,在这些领域中发挥着举足轻重的作用。阿里云GPU云服务器能够为各类复杂的计算任务提供高效、稳定的计算支持,助力企业和开发者在技术创新和业务拓展的道路上加速前行。本文将详细介绍阿里云GPU云服务器中的gn6v、gn7i、gn6i三个实例规格族的性能特点、区别及选择参考,帮助用户根据自身需求选择合适的GPU云服务器实例。
652 60
|
7月前
|
人工智能 负载均衡 调度
COMET:字节跳动开源MoE训练加速神器,单层1.96倍性能提升,节省百万GPU小时
COMET是字节跳动推出的针对Mixture-of-Experts(MoE)模型的优化系统,通过细粒度的计算-通信重叠技术,显著提升分布式训练效率,支持多种并行策略和大规模集群部署。
318 9
|
8月前
|
机器学习/深度学习 自然语言处理 API
阿里云零门槛、轻松部署您的专属 DeepSeek模型体验测试
DeepSeek R1是基于Transformer架构的先进大规模深度学习模型,2025年1月20日发布并开源,遵循MIT License。它在自然语言处理等任务上表现出色,高效提取特征,缩短训练时间。阿里云推出的满血版方案解决了服务器压力问题,提供100万免费token,云端部署降低成本,用户可快速启动体验。虽然回答速度有待提升,但整体表现优异,备受关注。
281 8
|
7月前
|
关系型数据库 测试技术 分布式数据库
刷新世界纪录!阿里云PolarDB凭借创新的「三层解耦」架构刷新TPC-C基准测试世界纪录
刷新世界纪录!阿里云PolarDB凭借创新的「三层解耦」架构刷新TPC-C基准测试世界纪录
|
10月前
|
传感器 安全 物联网
阿里云先知安全沙龙(北京站) ——车联网安全渗透测试思路分享
本文介绍了智能汽车的整车架构、协议栈结构、攻击点分析、渗透思路及案例分享。整车架构涵盖应用层、协议层和物理层,详细解析各层次功能模块和通信机制。攻击点包括Wi-Fi、USB、NFC等,展示车辆通信接口和系统组件的安全风险。渗透思路从信息收集到系统内部探索,利用固件漏洞控制车辆功能。案例展示了网段隔离不足导致的SSH访问和OTA日志审计漏洞,揭示了潜在的安全威胁。
|
11月前
|
机器学习/深度学习 测试技术 PyTorch
深度学习之测量GPU性能的方式
在深度学习中,测量GPU性能是一个多方面的任务,涉及运行时间、吞吐量、GPU利用率、内存使用情况、计算能力、端到端性能测试、显存带宽、框架自带性能工具和基准测试工具等多种方法。通过综合使用这些方法,可以全面评估和优化GPU的性能,提升深度学习任务的效率和效果。
831 5
|
11月前
|
人工智能 弹性计算 编解码
阿里云GPU云服务器性能、应用场景及收费标准和活动价格参考
GPU云服务器作为阿里云提供的一种高性能计算服务,通过结合GPU与CPU的计算能力,为用户在人工智能、高性能计算等领域提供了强大的支持。其具备覆盖范围广、超强计算能力、网络性能出色等优势,且计费方式灵活多样,能够满足不同用户的需求。目前用户购买阿里云gpu云服务器gn5 规格族(P100-16G)、gn6i 规格族(T4-16G)、gn6v 规格族(V100-16G)有优惠,本文为大家详细介绍阿里云gpu云服务器的相关性能及收费标准与最新活动价格情况,以供参考和选择。
|
9月前
|
机器学习/深度学习 运维 安全
深度学习在安全事件检测中的应用:守护数字世界的利器
深度学习在安全事件检测中的应用:守护数字世界的利器
332 22

热门文章

最新文章