阿里云GPU云服务器常见问题及官方资料解答汇总

本文涉及的产品
云服务器 ECS,每月免费额度200元 3个月
云服务器ECS,u1 2核4GB 1个月
公网NAT网关,每月750个小时 15CU
简介: 阿里云基于EGS平台推出了GPU云服务器,在提供GPU加速能力的同时,保留了与普通ECS实例一致的使用体验。您在创建ECS实例时,选择企业级异构计算规格即可。下面是阿里云GPU云服务器的一些常见问题及官方资料解答汇总,以供大家参考和了解阿里云GPU云服务器。

什么是GPU云服务器

阿里云GPU云服务器提供GPU加速计算能力,实现GPU计算资源的即开即用和弹性伸缩。作为阿里云弹性计算家族的一员,GPU云服务器结合了GPU计算力与CPU计算力,满足您在人工智能、高性能计算、专业图形图像处理等场景中的需求。产品详情链接:https://www.aliyun.com/product/ecs/gpu
阿里云gpu云服务器.png

GPU云服务器概念

名词 说明
GPU 图形处理器(Graphics Processing Unit)。相比CPU具有众多计算单元和更多的流水线,适合用于大规模并行计算等场景。
EGS 弹性GPU服务(Elastic GPU Service)。阿里云弹性计算和GPU高速的并行异构的加速器的组合服务,兼具弹性计算的特点和GPU的加速能力。
CUDA NVIDIA推出的通用并行计算架构,帮助您使用NVIDIA GPU解决复杂的计算问题。
cuDNN NVIDIA推出的用于深度神经网络的GPU加速库。
AIACC-Training 阿里云自研的AI加速器,可以显著提升训练性能。
AIACC-Inference 阿里云自研的AI加速器,可以显著提升推理性能。
FastGPU 阿里云推出的人工智能计算任务构建工具,提供便捷的接口和命令行,供您在阿里云IaaS资源上构建人工智能计算任务。
cGPU 隔离GPU资源,实现多个容器共用一张显卡。

为什么选择GPU云服务器

阿里云GPU云服务器是基于GPU与CPU应用的计算服务器。GPU在执行复杂的数学和几何计算方面有着独特的优势,特别是在浮点运算、并行运算等方面,GPU可以提供上百倍于CPU的计算能力。GPU的功能特性如下:

  • 拥有大量擅长处理大规模并发计算的算术逻辑单元(Arithmetic and Logic Unit,即ALU)。
  • 能够支持多线程并行的高吞吐量运算。
  • 逻辑控制单元相对简单。

下表为您介绍GPU云服务器与自建GPU服务器的区别。

对比项 GPU云服务器 GPU自建服务器 对比项
灵活性 能够快速开通一台或多台GPU云服务器实例。
实例规格(vCPU和内存)支持灵活变更,并且支持在线升降配。
带宽升降自由。
服务器购买周期长。
服务器规格固定,无法灵活变更。
带宽一次性购买,无法自由升降。
灵活性
易用性 Web在线管理,简单方便。
内置主流的操作系统,Windows正版激活,且支持在线更换操作系统。
GPU驱动可以在购买时一并安装,方便快捷。
没有在线管理工具,维护困难。
需用户自备操作系统,自行安装及更换。
GPU驱动需要自行购买安装。
易用性
容灾备份 三副本数据设计,单份损坏可在短时间内快速恢复。
硬件故障事故中可快速自动恢复。
用户自行搭建,使用普通存储设备,价格高昂。
数据损坏需用户修复。
容灾备份
安全性 能够有效阻止MAC欺骗和ARP攻击。
并防护DDoS攻击,可进行流量清洗和黑洞。
享有端口入侵扫描、挂马扫描、漏洞扫描等附加服务。
很难阻止MAC欺骗和ARP攻击。
清洗和黑洞设备需要另外购买,价格昂贵。
普遍存在漏洞挂马和端口扫描等问题。
安全性
成本 支持包年包月及按量付费两种购买方式,可灵活选择适合您业务场景的付费方式。
按需购买,无需一次性大量投入。
无法按需购买,必须为业务峰值满配。
一次性投入巨大,闲置浪费严重。
成本

购买阿里云GPU云服务器最新优惠政策

首次购买GPU云服务器如下配置包月4折,半年3.5折,1/2年3折,限1次,限1-3台(折扣不含带宽,系统盘,数据盘):
(1)gn6v(8核32G/32核128G/64核256G/82核336G)
(2)gn6i(4核15G/8核31G/16核62G/24核93G/40核155G/48核186G/96核372G)
(3)vgn6i、vgn6i-vws(4核32G/10核46G)
详情参考:阿里云服务器新人特惠活动,GPU新用户专享包年低至3折起。

阿里云GPU云服务器产品优势

1、高弹性
提供系列化的规格族,分钟级创建GPU实例,支持水平扩容和垂直变配。

2、高性能高安全性
支持GPUDirect,GPU之间点对点通信。GPU可以直接通过NVLink总线互联通信,具备高带宽低时延的特点,无需CPU干预。多租户间弹性GPU安全隔离 ,并通过Hypervisor授权和管理。允许灵活配置多块GPU实现互相高速通信的同时,还具备隔离带来的安全性。

3、易部署
和阿里云生态深度融合,您可以轻松搭配其他阿里云产品构建应用,例如搭配OSS、NAS等产品满足存储要求,搭配EMR进行深度学习数据预处理等。支持云原生(阿里云Kubernetes),交付更加便捷。

4、易监控
提供全面的GPU监控数据,包括GPU、实例和分组维度,免去您的运维压力。

阿里云GPU云服务器计费方式

GPU云服务器的计费相关功能和云服务器ECS一致,其中,计算资源(vCPU和内存)、镜像、块存储、公网带宽以及快照等资源涉及计费。常见的计费方式如下所示:

  • 包年包月:按一定时长购买资源,先付费后使用。
  • 按量付费:按需开通和释放资源,先使用后付费。
  • 抢占式实例:通过竞价模式抢占库存充足的计算资源,相对按量付费实例有一定的折扣,但是存在回收机制。
  • 预留实例券:搭配按量付费实例使用的抵扣券,承诺使用指定配置的实例(包括实例规格、地域可用区等),以折扣价抵扣计算资源的账单。
  • 节省计划:搭配按量付费实例使用的折扣权益计划,承诺使用稳定数量的资源(以元/小时为单位衡量),以折扣价抵扣计算资源、系统盘等资源的账单。
  • 存储容量单位包:搭配按量付费存储产品使用的资源包,承诺使用指定容量的存储资源,以折扣价抵扣块存储、NAS、OSS等资源的账单。

一台GPU实例包括计算资源(vCPU和内存)、镜像、块存储等资源,其中涉及计费的GPU资源如下表所示。

计费项 计费说明 计费方式 转换计费方式 计费标准
计算资源(vCPU和内存) 即实例规格涉及的计算资源费用(包括vCPU和内存)。 包年包月
按量付费
按量付费+预留实例券
抢占式实例
按量付费+节省计划
包年包月转按量付费
按量付费转包年包月
实例规格计费
镜像 根据镜像类型以及使用情况决定是否收费。例如,公共镜像、自定义镜像、共享镜像或镜像市场镜像的计费情况也有所区别。 包年包月
按量付费
按量付费+预留实例券
不支持 镜像计费
块存储 云盘:根据单价、云盘容量和使用时长收取费用,并且创建云盘的方式不同会影响支持的计费方式。
本地盘:与特定实例规格绑定的本地盘,不支持单独购买,且费用已计入实例规格费用。
包年包月
按量付费
存储容量单位包
按量付费+节省计划
转换云盘计费方式
包年包月转按量付费
按量付费转包年包月
块存储计费
公网带宽 使用固定公网IP访问公网时,仅收取公网出网带宽费用。
使用弹性公网IP(EIP)或NAT网关访问公网时,弹性公网IP(EIP)和NAT网关是需要独立购买。
按固定带宽计费
按使用流量计费
转换公网带宽计费方式 公网带宽计费
快照 快照的计费项目包括快照、快照复制以及快照极速可用。计费时会按快照容量和存储时长收取费用。 快照的计费项目包括快照、快照复制以及快照极速可用。计费时会按快照容量和存储时长收取费用。 不支持 快照计费

阿里云GPU云服务器应用场景

1、直播实时视频转码
阿里云异构GPU和FPGA服务器重点支持2019年天猫双11狂欢夜直播的实时视频转码,以高画质、低带宽、高分辨率、实时的综合优势服务天猫双11狂欢夜当天直播业务4K、2K、1080P等各个分辨率的转码。其中FPGA H.265高清编码、720P节省带宽21.6%,GPU云服务器支持高并发实时视频流5000路以上,并逐步上升到峰值6200路每分钟,且顺利度过流量洪峰。异构GPU云服务器还参与实时家居渲染图片生成等业务,首次提供了大量算力强劲的ebmgn6v裸金属实例,支持淘宝渲染方提升几十倍的渲染性能,第一次实现秒级实时渲染,完成总计超过5000张大型家居渲染图。异构FPGA图片转码业务则以3K+片的超大集群,为淘宝图片空间提供高达数百万QPS的处理能力,承担了双十一淘宝图片85%的流量,预计节省计算成本3亿。

2、AI训练
gn6v和gn6e具有优异的通用GPU计算加速能力,适合为深度学习提供加速引擎。
gn6v和gn6e实例分别配备具有16 GB显存和32 GB显存的NVIDIA V100 GPU计算卡,单节点可提供高达1000TFLOPS的混合精度计算能力。与弹性计算生态的完美结合,为在线和离线场景提供了通用的解决方案。搭配容器服务使用,可以简化部署和运维的复杂度,并提供资源调度服务。

3、AI推理
gn6i具有优异的AI推理能力。
gn6i实例基于配备NVIDIA Tesla T4 GPU计算卡,单精度浮点计算能力最高可达8.1 TFLOPS,int8定点运算处理能力最高可达130 TOPS,支持混合精度,满足了深度学习(尤其是推理)场景下的算力需求。同时单卡功耗仅75 W,具有极高的性能功耗比。与弹性计算生态的完美结合,为在线和离线场景提供了通用的解决方案。搭配容器服务使用,可以简化部署和运维的复杂度,并提供资源调度服务。镜像市场提供预装NVIDIA GPU驱动和深度学习框架的镜像,简化您的部署操作。

4、云游戏、云网吧和云端图形工作站
vgn6i和gn6i均采用基于Turing架构的NVIDIA Tesla T4 GPU加速器,具有极佳的图形计算能力。vgn6i提供分片虚拟化后的虚拟GPU,支持T4 GPU计算能力的1/2、1/4、1/8,并提供极佳的3D图像渲染能力,适用于云游戏、云网吧等场景。vgn6i和gn6i实例可以结合云桌面产品提供云端图形工作站服务,应用于影视动画设计、工业设计、医疗成像、高性能计算的结果呈现等场景。

阿里云GPU云服务器使用限制

GPU实例作为云服务器ECS的一类实例规格,保持了与ECS实例相同的使用限制。使用云服务器ECS有下列限制:

  • 仅弹性裸金属服务器和超级计算集群支持二次虚拟化,其他规格族不支持安装虚拟化软件和二次虚拟化。
  • 不支持声卡应用。
  • 不支持直接加载外接硬件设备(如硬件加密狗、U盘、外接硬盘、银行UKey等),您可以尝试软件加密狗或者动态口令二次验证等。
  • 不支持多播协议。如果需要使用多播,建议改为使用单播点对点方式。
  • 日志服务不支持32位Linux系统云服务器。
  • 如果云服务器需要备案,则云服务器有购买要求,且每台ECS实例可申请的备案服务号数量有限。
  • 部分软件或应用的许可证(License)需要与云服务器的硬件信息绑定。当云服务器进行迁移操作时可能会引起硬件信息的变更,进而导致License失效。

阿里云GPU云服务器实例规格族有哪些?

1、GPU计算型

  • GPU计算型实例规格族gn7s
  • GPU计算型实例规格族gn7e
  • GPU计算型实例规格族gn7i
  • GPU计算型实例规格族gn7
  • GPU计算型实例规格族gn6i
  • GPU计算型实例规格族gn6e
  • GPU计算型实例规格族gn6v
  • GPU计算型弹性裸金属服务器实例规格族ebmgn7e
  • GPU计算型弹性裸金属服务器实例规格族ebmgn7i
  • GPU计算型弹性裸金属服务器实例规格族ebmgn7
  • GPU计算型弹性裸金属服务器实例规格族ebmgn6ia
  • GPU计算型弹性裸金属服务器实例规格族ebmgn6e
  • GPU计算型弹性裸金属服务器实例规格族ebmgn6v
  • GPU计算型弹性裸金属服务器实例规格族ebmgn6i
  • GPU计算型超级计算集群实例规格族sccgn7ex
  • GPU计算型超级计算集群实例规格族sccgn6e
  • GPU计算型超级计算集群实例规格族sccgn6

2、GPU虚拟化型

  • GPU虚拟化型实例规格族sgn7i-vws(共享CPU)
  • GPU虚拟化型实例规格族vgn7i-vws
  • GPU虚拟化型实例规格族vgn6i
  • GPU虚拟化型实例规格族vgn5i

3、异构服务型

  • 异构服务型实例规格族video-enhance
  • 异构服务型实例规格族video-trans
相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
2天前
|
弹性计算 运维 监控
解密阿里云弹性计算:探索云服务器ECS的核心功能
阿里云ECS是核心计算服务,提供弹性云服务器资源,支持实例按需配置、集群管理和监控,集成安全防护,确保服务稳定、安全,助力高效业务运营。
14 0
|
2天前
|
负载均衡 固态存储 Linux
阿里云轻量应用服务器、云服务器、gpu云服务器最新收费标准参考
轻量应用服务器、云服务器、gpu云服务器是阿里云服务器产品中,比较热门的云服务器产品类型,不同类型的云服务器产品收费模式与收费标准是不一样的,本文为大家展示这几个云服务器产品的最新收费标准情况,以供参考。
阿里云轻量应用服务器、云服务器、gpu云服务器最新收费标准参考
|
2天前
|
弹性计算 负载均衡 容灾
应用阿里云弹性计算:打造高可用性云服务器ECS架构
阿里云弹性计算助力构建高可用云服务器ECS架构,通过实例分布、负载均衡、弹性IP、数据备份及多可用区部署,确保业务连续稳定。自动容错和迁移功能进一步增强容灾能力,提供全方位高可用保障。
12 0
|
2天前
|
存储 弹性计算 监控
探索阿里云弹性计算:如何优化云服务器ECS的性能与成本
在云时代,【阿里云ECS】的性能优化与成本控制至关重要。利用实例规格选择、自动伸缩、网络和存储配置,可增强性能、减少成本。结合监控工具和优化建议,用户能解决性能问题,提升应用稳定性,实现高效且经济的云计算运营。
9 1
|
3天前
|
弹性计算 运维 安全
阿里云ecs使用体验
整了台服务器部署项目上线
|
4天前
|
编解码 缓存 安全
阿里云目前活动内各云服务器实例规格适用场景与价格参考
目前阿里云的活动中,云服务器有多种不同实例规格可选,实例规格定义了实例的基本属性:CPU和内存(包括CPU型号、主频等),但是不同实例规格所适用的场景是不一样的,价格也有很大差别,有的用户初次选购阿里云服务器可能并不知道这些实例规格的具体适用场景,下面是小编整理汇总的2024年截止目前阿里云的活动中云服务器实例规格适用场景与活动价格,以供参考。
阿里云目前活动内各云服务器实例规格适用场景与价格参考
|
5天前
|
弹性计算
阿里云ECS的使用心得
本文主要讲述了我是如何了解到ECS,使用ECS的一些经验,以及自己的感悟心得
|
5天前
|
弹性计算
阿里云ECS使用体验
在申请高校学生免费体验阿里云ECS云服务器后的一些使用体验和感受。
|
7天前
|
弹性计算 运维 安全
阿里云ecs使用体验
整了台服务器部署项目上线
|
7天前
|
弹性计算 运维 数据安全/隐私保护
【雾锁王国开服】阿里云一键部署雾锁王国联机服务器详细教程
阿里云提供雾锁王国服务器搭建教程,借助计算巢服务,用户可在3分钟内创建Enshrouded游戏服务器。8核32G服务器1个月109元,3个月327元;4核16G10M带宽1个月30元,3个月90元。需先注册并实名认证阿里云账号,然后通过傻瓜式一键部署入口进行购买和设置,包括地域、购买时长、服务器参数等。部署完成后,分享服务器信息给游戏伙伴,即可开始游戏。详细教程和更多配置信息可在阿里云ECS产品页查看。
24 0