阿里云GPU 云服务器(GPU Cloud Computing,GPU)是提供 GPU 算力的弹性计算服务,具有超强的计算能力,服务于深度学习、科学计算、图形可视化、视频处理多种应用场景。阿里云作为亚太第一的云服务提供商,随时为您提供触手可得的算力,有效缓解计算压力,提升您的业务效率,助您提高企业竞争力。
什么是GPU服务器?
GPU云服务器提供GPU加速计算能力,实现GPU计算资源的即开即用和弹性伸缩。作为阿里云弹性计算家族的一员,GPU云服务器结合了GPU计算力与CPU计算力,满足您在人工智能、高性能计算、专业图形图像处理等场景中的需求。
详细参考GPU服务器官方页面的详细介绍:https://www.aliyun.com/product/ecs/gpu
为什么选择GPU服务器?
阿里云GPU云服务器是基于GPU与CPU应用的计算服务器。GPU在执行复杂的数学和几何计算方面有着独特的优势,特别是在浮点运算、并行运算等方面,GPU可以提供比CPU高百倍的计算能力。GPU的功能特性如下:
- 拥有大量擅长处理大规模并发计算的算术逻辑单元(Arithmetic and Logic Unit,即ALU)。
- 能够支持多线程并行的高吞吐量运算。
- 逻辑控制单元相对简单。
GPU云服务器和自建GPU服务器的区别对比
对比项 | GPU云服务器 | GPU自建服务器 |
---|---|---|
灵活性 | 能够快速开通一台或多台GPU云服务器实例。实例规格(vCPU、内存及GPU)支持灵活变更,并且支持在线升降配。带宽升降自由。 | 服务器购买周期长。服务器规格固定,无法灵活变更。带宽一次性购买,无法自由升降。 |
易用性 | Web在线管理,简单方便。内置主流的操作系统,Windows正版激活,且支持在线更换操作系统。GPU驱动可以在购买时一并安装,方便快捷。 | 没有在线管理工具,维护困难。需用户自备操作系统,自行安装及更换。GPU驱动需要自行购买安装。 |
容灾备份 | 三副本数据设计,单份损坏可在短时间内快速恢复。硬件故障事故中可快速自动恢复。 | 用户自行搭建,使用普通存储设备,价格高昂。数据损坏需用户修复。 |
安全性 | 能够有效阻止MAC欺骗和ARP攻击。并防护DDoS攻击,可进行流量清洗和黑洞。享有端口入侵扫描、挂马扫描、漏洞扫描等附加服务。 | 很难阻止MAC欺骗和ARP攻击。清洗和黑洞设备需要另外购买,价格昂贵。普遍存在漏洞挂马和端口扫描等问题。 |
成本 | 支持包年包月及按量付费两种购买方式,可灵活选择适合您业务场景的付费方式。按需购买,无需一次性大量投入。 | 无法按需购买,必须为业务峰值满配。一次性投入巨大,闲置浪费严重。 |
阿里云GPU实例规格族有哪些?
阿里云GPU服务器分为GPU计算型(gn系列)、GPU虚拟化型和异构服务型,阿小云列举几款常见的阿里云GPU服务器实例规格:
- GPU计算型实例规格族gn8is
- GPU计算型实例规格族gn7e
- GPU计算型实例规格族gn7i
- GPU计算型实例规格族gn7s
- GPU计算型实例规格族gn7
- GPU计算型实例规格族gn7r
- GPU计算型实例规格族gn6i
- GPU计算型实例规格族gn6e
- GPU计算型实例规格族gn6v
- GPU计算型弹性裸金属服务器实例规格族ebmgn8is
- GPU计算型弹性裸金属服务器实例规格族ebmgn7ex
- GPU计算型弹性裸金属服务器实例规格族ebmgn7e
- GPU计算型弹性裸金属服务器实例规格族ebmgn7ix
- GPU计算型弹性裸金属服务器实例规格族ebmgn7i
- GPU计算型弹性裸金属服务器实例规格族ebmgn7
- GPU计算型弹性裸金属服务器实例规格族ebmgn6ia
- GPU计算型弹性裸金属服务器实例规格族ebmgn6e
- GPU计算型弹性裸金属服务器实例规格族ebmgn6v
- GPU计算型弹性裸金属服务器实例规格族ebmgn6i
- GPU计算型超级计算集群实例规格族sccgn7ex
- GPU虚拟化型实例规格族sgn7i-vws(共享CPU)
- GPU虚拟化型实例规格族vgn7i-vws
- GPU虚拟化型实例规格族vgn6i-vws
- video-trans实例规格
阿里云GPU服务器租赁费用
阿里云GPU服务器租用价格表包括包年包月价格、一个小时收费以及学生GPU服务器租用费用,阿里云GPU计算卡包括NVIDIA V100计算卡、T4计算卡、A10计算卡和A100计算卡,GPU云服务器gn6i可享受3折优惠,阿小云整理阿里云GPU服务器租用价格表、GPU一个小时多少钱以及学生GPU服务器收费价格表:
GPU服务器 | GPU | CPU内存 | 实例规格 | 租用费用 |
---|---|---|---|---|
GPU云服务器gn6v | 16G显存V100计算卡 | 8核32G | ecs.gn6v-c8g1.2xlarge | 4685.20元/月、4685.20元6个月、46097.40元一年、 |
GPU云服务器gn6v | 16G显存V100计算卡 | 32核128G | ecs.gn6v-c8g1.8xlarge | 18629.80元/月、100806.00元6个月 |
GPU云服务器gn6i | 16G显存T4计算卡 | 4核15G | ecs.gn6i-c4g1.xlarge | 1878.40元/月、9261.60元6个月、14439.00元一年、37114.20元三年 |
GPU云服务器gn6i | 16G显存T4计算卡 | 8核31G | ecs.gn6i-c8g1.2xlarge | 2254.60元/月、11108.40元6个月、17311.80元一年、44501.40元三年 |
GPU云服务器gn6i | 16G显存T4计算卡 | 16核62G | ecs.gn6i-c16g1.4xlarge | 2635.75元/月、12979.50元6个月、20222.40元一年、51985.80元三年 |
GPU云服务器gn6i | 16G显存T4计算卡 | 24核93G | ecs.gn6i-c24g1.6xlarge | 2759.50元/月、13587.00元6个月、20222.40元一年、54415.80元三年 |
GPU云服务器gn7i | 24G显存A10计算卡 | 8核30G | ecs.gn7i-c8g1.2xlarge | 6143.88元/月 |
GPU云服务器gn7e | 80G显存A100计算卡 | 16核125G | ecs.gn7e-c16g1.4xlarge | 170533.80元一年 |
更多GPU服务器配置和精准报价,请移步到GPU服务器官方页面 https://www.aliyun.com/product/ecs/gpu
阿里云GPU服务器多少钱一小时?
阿里云GPU服务器计费模式支持包年包月和按量计费模式,按量计费模式是使用后付费模式,按照小时结算费用,GPU云服务器规格不同每小时价格也不同:
- GPU计算型gn7e实例、16核125G内存、NVIDIA A100,价格:34.742元/小时;
- GPU计算型gn7i实例、8核30G内存、NVIDIA A10,价格:12.710156元/小时;
- GPU计算型gn6v实例、8核32G内存、 NVIDIA V100,价格:26.46元/小时;
- GPU计算型gn6i实例、40核155G内存、NVIDIA T4,价格:14.819元/小时;
- GPU计算型gn6e实例、12核92G内存、NVIDIA V100,价格:19.739元/小时;
- GPU计算型gn5实例、4核30G内存、NVIDIA P100,价格:12.78元/小时。
阿里云GPU服务器优势
覆盖范围广阔
阿里云GPU云服务器在全球17个地域实现规模部署,覆盖范围广,结合弹性供应、弹性伸缩等交付方式,能够很好地满足您业务的突发需求。超强计算能力
阿里云GPU云服务器配备业界超强算力的GPU计算卡,结合高性能CPU平台,单实例可提供高达1000 TFLOPS的混合精度计算性能。网络性能出色
阿里云GPU云服务器实例的VPC网络最大支持450万的PPS及32 Gbit/s的内网带宽。在此基础上,超级计算集群产品中,节点间额外提供高达50 Gbit/s的RDMA网络,满足节点间数据传输的低延时高带宽要求。购买方式灵活
支持灵活的资源付费模式,包括包年包月、按量付费、抢占式实例、预留实例券、存储容量单位包。您可以按需要购买,避免资源浪费。
GPU服务器计费说明
GPU云服务器的计费相关功能和云服务器ECS一致,其中,计算资源(vCPU、内存以及GPU)、镜像、块存储、公网带宽以及快照等资源涉及计费。
常见的计费方式如下所示:
- 包年包月:按一定时长购买资源,先付费后使用。
- 按量付费:按需开通和释放资源,先使用后付费。
- 抢占式实例:通过竞价模式抢占库存充足的计算资源,相对按量付费实例有一定的折扣,但是存在回收机制。
- 预留实例券:搭配按量付费实例使用的抵扣券,承诺使用指定配置的实例(包括实例规格、地域可用区等),以折扣价抵扣计算资源的账单。
- 节省计划:搭配按量付费实例使用的折扣权益计划,承诺使用稳定数量的资源(以元/小时为单位衡量),以折扣价抵扣计算资源、系统盘等资源的账单。
- 存储容量单位包:搭配按量付费存储产品使用的资源包,承诺使用指定容量的存储资源,以折扣价抵扣块存储、NAS、OSS等资源的账单。
GPU服务器工具包
阿里云提供神行工具包供您更高效地使用GPU资源,神行工具包中的组件主要包括以下工具:
工具名称 | 说明 |
---|---|
神龙AI训练加速引擎AIACC-Training(AIACC训练加速) | 阿里云自研的分布式训练任务AI加速器,可以显著提升训练性能。 |
神龙AI推理加速引擎AIACC-Inference(AIACC推理加速) | 阿里云自研的推理AI加速器,可以显著提升推理性能。 |
AI加速器Deepytorch | 阿里云自研的AI加速器,为生成式AI和大模型场景提供训练和推理加速功能。 |
什么是AI通信加速库Deepnccl | 阿里云开发的一种用于多GPU互联的AI通信加速库,在AI分布式训练或多卡推理任务中用于提升通信效率。 |
什么是推理引擎DeepGPU-LLM | 阿里云开发的大语言模型(Large Language Model,LLM)推理引擎,在处理大语言模型任务中为您提供高性能的大模型推理服务。 |
AI分布式训练通信优化库AIACC-ACSpeed | 阿里云推出的AI分布式训练通信优化库。可实现分布式训练在兼容性、适用性和性能加速等方面的升级。 |
计算优化编译器AIACC-AGSpeed | 阿里云推出的一个基于PyTorch深度学习框架研发的计算优化编译器,可以实现无感的计算优化功能。 |
GPU容器共享技术cGPU | 阿里云基于内核虚拟GPU隔离的容器共享技术,隔离GPU资源,实现多个容器共用一张显卡。 |
集群极速部署工具FastGPU | 阿里云推出的人工智能计算任务构建工具,提供便捷的接口和命令行,供您在阿里云IaaS资源上构建人工智能计算任务。 |
阿里云GPU云服务器的应用场景
直播实时视频转码
阿里云GPU云服务器重点支持2019年天猫双11狂欢夜直播的实时视频转码,以高画质、低带宽、高分辨率、实时的综合优势服务于天猫双11狂欢夜当天直播业务4K、2K、1080P等各个分辨率的转码。具体说明如下:
- GPU云服务器支持高并发实时视频流5000路以上,并逐步上升到峰值6200路每分钟,且顺利度过流量洪峰。
- GPU云服务器参与实时家居渲染图片生成等业务,首次提供了大量算力强劲的ebmgn6v裸金属实例,支持淘宝渲染方提升几十倍的渲染性能,第一次实现秒级实时渲染,完成总计超过5000张大型家居渲染图。
AI训练
GPU计算型实例规格族gn6v和gn6e具有优异的通用GPU计算加速能力,适合为深度学习提供加速引擎。具体说明如下:
- gn6v实例配备具有16 GB显存的NVIDIA V100 GPU计算卡,gn6e实例配备具有32 GB显存的NVIDIA V100 GPU计算卡,单节点可提供高达1000 TFlops的
- 混合精度计算能力。
- 实例与弹性计算生态的完美结合,为在线和离线场景提供了通用的解决方案。
实例搭配容器服务使用,可以简化部署和运维的复杂度,提供资源调度服务。
AI推理
GPU计算型实例规格族gn6i具有优异的AI推理能力,满足了深度学习(尤其是推理)场景下的算力需求。具体说明如下:
- gn6i实例基于配备NVIDIA Tesla T4 GPU计算卡,单精度浮点计算能力最高可达8.1 TFlops,int8定点运算处理能力最高可达130 TOPS,支持混合精度。
- 单卡功耗仅75 W,具有极高的性能功耗比。
- 实例与弹性计算生态的完美结合,为在线和离线场景提供了通用的解决方案。
- 实例搭配容器服务使用,可以简化部署和运维的复杂度,并提供资源调度服务。
- 镜像市场提供预装NVIDIA GPU驱动和深度学习框架的镜像,简化您的部署操作。
云端图形工作站
GPU计算型实例规格族gn6i采用基于Turing架构的NVIDIA Tesla T4 GPU加速器,具有极佳的图形计算能力。gn6i实例可以结合云桌面产品提供云端图形工作站服务,应用于影视动画设计、工业设计、医疗成像、高性能计算的结果呈现等场景。
GPU云服务器名词解释
概念 | 说明 |
---|---|
GPU | 图形处理器(Graphics Processing Unit)。相比CPU具有众多计算单元和更多的流水线,适合用于大规模并行计算等场景。 |
CUDA | NVIDIA推出的通用并行计算架构,帮助您使用NVIDIA GPU解决复杂的计算问题。 |
cuDNN | NVIDIA推出的用于深度神经网络的GPU加速库。 |
DeepGPU | 阿里云专门为GPU云服务器搭配的具有GPU计算服务增强能力的免费工具集合。 |
AIACC-Taining | 阿里云自研的分布式训练任务AI加速器,可以显著提升训练性能。 |
AIACC-Inference | 阿里云自研的推理AI加速器,可以显著提升推理性能。 |
AIACC-ACSpeed | 阿里云推出的AI分布式训练通信优化库。可实现分布式训练在兼容性、适用性和性能加速等方面的升级。 |
AIACC-AGSpeed | 阿里云推出的一个基于PyTorch深度学习框架研发的计算优化编译器。可以实现无感的计算优化功能。 |
FastGPU | 阿里云推出的人工智能计算任务构建工具。提供便捷的接口和命令行,供您在阿里云IaaS资源上构建人工智能计算任务。 |
cGPU | 阿里云基于内核虚拟GPU隔离的容器共享技术。隔离GPU资源,实现多个容器共用一张显卡。 |
更多关于阿里云GPU服务器介绍,请移步:https://www.aliyun.com/product/ecs/gpu