带你读《弹性计算技术指导及场景应用》——3. vGPU驱动自动安装和升级

本文涉及的产品
轻量应用服务器 2vCPU 4GiB,适用于搭建容器环境
轻量应用服务器 4vCPU 16GiB,适用于搭建游戏自建服
无影云电脑企业版,4核8GB 120小时 1个月
简介: 带你读《弹性计算技术指导及场景应用》——3. vGPU驱动自动安装和升级

简介:为了适配最新的渲染软件,以及驱动稳定性的提升,vGPU实例的驱动需要定期进行升级,因为使用vgpu的客户多数为渲染和云游戏等业务场景,对vGPU驱动的快速升级和批量自动化要求比较高。

背景:为了适配最新的渲染软件,以及驱动稳定性的提升,vGPU实例的驱动需要定期进行升级,因为使用vgpu的客户多数为渲染和云游戏等业务场景,对vGPU驱动的快速升级和批量自动化要求比较高,这些升级操作在没有完全自动化以前,每次版本升级需要投入的人力都在1-2人月,为了有效降低运维人力投入以及客户侧运维的投入并提升运维升级的效率,为此我们提供了多种vGPU驱动升级方案,本篇主要介绍使用云助手插件自动完成vGPU驱动安装和升级。

适用场景

针对的客户场景主要是云桌面和云游戏等客户,要求使用最新的GRID驱动以适配最新的渲染软件和游戏引擎,同时又需要具备批量自动化的运维方式支持,也同样适用于购买了GPU或者vGPU实例后,需要进行图形加速能力而不知道应该具体安装哪款GRID驱动的用户,只需要通过云助手执行一条指令就可以自动完成GRID驱动的升级或者全新安装,云助手本身支持批量调用。

 

实现原理

image.png

使用方法:

Windows系统:

1)登录ECS管理控制台

2)在左侧导航栏,选择运维与监控 > 发送命令/文件(云助手)。

3)在页面左侧顶部,选择目标资源所在的地域。

image.png

4)在ECS实例页签下的实例列表,选择目标实例,单击对应操作栏下的执行命令。

image.png

5)通过创建并执行云助手命令来升级或安装GRID驱动。

image.png

Windows系统执行命令行如下(直接复制粘贴即可)

$InstalledPlugins = $(acs-plugin-manager --list --local)
if ($($InstalledPlugins | Select-String "grid_driver_install"))
   {
     acs-plugin-manager --remove --plugin grid_driver_install
   } 
acs-plugin-manager --fetchTimeout 0 --exec --plugin grid_driver_install



6) 执行命令行后,可能会返回两种结果,1是改实例未安装过GRID驱动,进行全新安装,2是该实例已经安装过旧版本的GRID驱动,需要升级安装。区别就是驱动的升级安装是执行2次同样的命令行,系统内部会自动就行逻辑处理,全新安装只需要执行一次命令行。

下图是已经安装过旧版本GRID驱动,需要先卸载旧版本驱动,再安装新版本驱动:

卸载完旧版本驱动之后需要重启一次实例,然后再次执行上面给的命令行进行驱动安装

image.png

下图是全新安装驱动的返回日志截图:

image.png

7)验证升级或安装的GRID驱动是否生效

安装完成后,重启实例,然后远程连接实例,桌面右键打开 NVIDIA控制面板

image.png

显示结果如下所示,表示安装的新GRID驱动已生效

image.png

Linux系统

1)登录ECS管理控制台

2)在左侧导航栏,选择运维与监控 > 发送命令/文件(云助手)。

3)在页面左侧顶部,选择目标资源所在的地域。

image.png

4)在ECS实例页签下的实例列表,选择目标实例,单击对应操作栏下的执行命令。

image.png

5)通过创建并执行云助手命令来升级或安装GRID驱动。

image.png

 

6) 执行命令行,Linux系统因为卸载驱动和安装驱动可以自动完成,不需要重启实例,所以不管是全新安装还是升级安装,都是只需执行一次命令行即可。

Linux系统执行命令行如下(直接复制粘贴即可)

if acs-plugin-manager --list --local | grep grid_driver_install > /dev/null 2>&1
then
acs-plugin-manager --remove --plugin grid_driver_install
fi
acs-plugin-manager --exec --plugin grid_driver_install

命令执行之后的日志截图:

image.png

7)验证升级或安装的GRID驱动是否生效

安装完成后,然后远程连接实例,执行 nvidia-smi指令,显示结果如下图,表示已成功升级或安装GRID驱动。

image.png

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
10月前
|
弹性计算 并行计算 UED
带你读《弹性计算技术指导及场景应用》——4. 自动安装NVIDIA GPU驱动和CUDA组件
带你读《弹性计算技术指导及场景应用》——4. 自动安装NVIDIA GPU驱动和CUDA组件
182 0
|
10月前
|
弹性计算 Linux 测试技术
带你读《弹性计算技术指导及场景应用》——1. 单实例上运行Linux桌面多开解决方案(2)
带你读《弹性计算技术指导及场景应用》——1. 单实例上运行Linux桌面多开解决方案(2)
210 0
|
10月前
|
弹性计算 Unix Linux
带你读《弹性计算技术指导及场景应用》——1. 单实例上运行Linux桌面多开解决方案(1)
带你读《弹性计算技术指导及场景应用》——1. 单实例上运行Linux桌面多开解决方案(1)
186 2
|
Cloud Native 大数据 数据处理
首次:磐久服务器M系列和倚天710芯片双双通过PCIe 5.0官方认证
全球范围内首个通过PCIe 5.0认证测试的量产服务器硬件系统和数据中心服务器芯片
首次:磐久服务器M系列和倚天710芯片双双通过PCIe 5.0官方认证
|
24天前
|
人工智能 并行计算 安全
用户实操:如何以龙蜥操作系统为底座在 CPU 上运行 DeepSeek-R1
介绍如何在 CPU 上使用 llama.cpp 推理 671B 版本的 DeepSeek R1,以及实际效果。
|
存储 弹性计算 运维
带你读《弹性计算—无处不在的算力》第三章:计算产品和技术3.2虚拟机云服务器(一)
《弹性计算—无处不在的算力》第三章:计算产品和技术3.2虚拟机云服务器(一)
595 0
带你读《弹性计算—无处不在的算力》第三章:计算产品和技术3.2虚拟机云服务器(一)
|
机器学习/深度学习 弹性计算 资源调度
带你读《弹性计算—无处不在的算力》第三章:计算产品和技术3.2虚拟机云服务器(二)
《弹性计算—无处不在的算力》第三章:计算产品和技术3.2虚拟机云服务器(二)
420 0
带你读《弹性计算—无处不在的算力》第三章:计算产品和技术3.2虚拟机云服务器(二)
|
10月前
|
存储 KVM 虚拟化
倚天产品介绍|倚天虚拟化:虚拟机热迁移特性介绍
热迁移分为热迁移和冷迁移,冷迁移过程中有一段明显的时间VM的服务不可用,而热迁移的服务的服务暂停时间非常短。热迁移过程中无需关闭或者长时间暂停VM,VM保持正常运行,只有在热迁移临近结束时有一个非常短暂的停机切换时间。热迁移可保证了VM服务的可用性,提升业务的连续性和用户体验。
|
弹性计算 数据库 云计算
阿里云发布企业级ECS产品线,国内首个上线Skylake CPU+25G实例
8月10日,阿里云发布企业级ECS产品线,在发布会上全新一代基于Skylake+25G网络的实例,得到了极大的关注,同时全新一代G5/C5/R5实例已经在青岛地域率先上线,成为中国第一家上线Skylake+25G网络的云服务商。
5855 0