带你读《弹性计算技术指导及场景应用》——1. 单实例上运行Linux桌面多开解决方案(2)

本文涉及的产品
云服务器 ECS,每月免费额度200元 3个月
云服务器ECS,u1 2核4GB 1个月
简介: 带你读《弹性计算技术指导及场景应用》——1. 单实例上运行Linux桌面多开解决方案(2)

带你读《弹性计算技术指导及场景应用》——1. 单实例上运行Linux桌面多开解决方案(1):https://developer.aliyun.com/article/1423692


使用EGL Backend

使用EGL Backend时,Host上不用安装Xorgxfce4x11vnc等组件,只需要安装NVIDIA驱动,创建容器时,也不用将X11unix socket目录(/tmp/.X11-unix)映射给容器访问。

Host安装与设置

Host上安装与配置步骤如下:

∙        安装NVIDIA驱动;

∙        安装nvidia-docker2

∙        下载NVIDIA官方docker镜像(比如nvidia/cuda:14.3-base-ubuntu18.04);

∙        启动容器(启动时,不需要将/tmp/.X11-unix映射到容器中);

容器安装与设置

容器中安装与配置步骤如下:

∙        安装桌面环境(本文安装xfce4);

∙        VirtualGL官方网站下载VirtualGLTurboVNC安装包进行安装;

∙        配置VirtualGL/opt/VirtualGL/bin/vglserver_config -config +s +f +t

∙        安装NVIDIA用户态驱动(容器中安装驱动时,不要安装内核态驱动),命令示例:./NVIDIA-Linux-x86_64-470.80run -a -q --ui=none --no-kernel-module

∙        启动运行TurboVNC

export TVNC_VGLRUN="vglrun -d egl0 +wm"

/opt/TurboVNC/bin/vncserver -wm xfce -vgl -geometry 1920x1080 -depth 24

其中egl0表示第一个GPU;

性能测试

glmark2测试结果

分别在Host上和Container中,使用glmark2软件,设置不同的2D X ServerDISPLAY环境变量)以及不同的Backendvglrun命令的-d参数),测试跑分,结果如下表所示。

编号

测试

位置

Xfce4

Backend

使用VirtualGL

测试命令

画面

输出

GPU

使用率

glmark2

CPU使用率

Host Xorg

CPU使用率

Xvnc CPU

使用率

glmark2

得分

1

Host

/

DISPLAY=:0 glmark2

Host(:0)

100%

100%

400%

0.00%

11350

2

Host

GLX

DISPLAY=:0 vglrun -d :0 glmark2

Host(:0)

79%

45%

900%

0.00%

849

3

Host

GLX

DISPLAY=:1 vglrun -d :0 glmark2

Host(:1)

39%

105%

4.00%

67.00%

2086

4

Host

GLX

DISPLAY=:0 vglrun -d egl glmark2

Host(:0)

83%

53%

98.00%

0.00%

902

5

Host

GLX

DISPLAY=:1 vglrun -d egl glmark2

Host(:1)

39%

107%

0.00%

64.00%

1851

6

Host

EGL

DISPLAY=:0 vglrun -d :0 glmark2

Host(:0)

81%

46%

900%

0.00%

842

7

Host

EGL

DISPLAY=:1 vglrun -d :0 glmark2

Host(:1)

39%

104%

4.00%

69.00%

2041

8

Host

EGL

DISPLAY=:0 vglrun -d egl glmark2

Host(:0)

82%

53%

98.00%

0.00%

899

9

Host

EGL

DISPLAY=:1 vglrun -d egl glmark2

Host(:1)

39%

105%

0.00%

66.00%

1844

10

Container

/

DISPLAY=:0 glmark2

Host(:0)

100%

100%

47.00%

0.00%

11204

11

Container

GLX

DISPLAY=:0 vglrun -d :0 glmark2

Host(:0)

89%

60%

100%

0%

962

12

Container

GLX

DISPLAY=:1 vglrun -d :0 glmark2

Container(:1)

39%

105%

4%

68%

2052

13

Container

GLX

DISPLAY=:0 vglrun -d egl glmark2

Host(:0)

89%

92%

99%

0%

1522

14

Container

GLX

DISPLAY=:1 vglrun -d egl glmark2

Container(:1)

39%

106%

0%

62%

1862

15

Container

EGL

DISPLAY=:0 vglrun -d :0 glmark2

Host(:0)

89%

61%

98%

0%

951

16

Container

EGL

DISPLAY=:1 vglrun -d :0 glmark2

Container(:1)

39%

105%

4%

64%

2012

17

Container

EGL

DISPLAY=:0 vglrun -d egl glmark2

Host(:0)

89%

92%

99%

0%

1519

18

Container

EGL

DISPLAY=:1 vglrun -d egl glmark2

Container(:1)

39%

106%

0%

64%

1837



GpuTest测试结果

编号

测试位置

Xfce4 Backend

使用VirtualGL

测试命令

画面输出

GPU总使用率

GpuTest CPU使用率

Host Xorg CPU使用率

Xvnc CPU使用率

得分

FPS

19

Host

/

DISPLAY=:0 ./GpuTest /test=gi /width=1600 /height=900 /benchmark

Host(:0)

100.00%

100.00%

88.00%

0.00%

15730

262

20

Host

/

DISPLAY=:0 ./GpuTest /test=gi /width=1600 /height=900 /benchmark

Host(:0)

100.00%

100.00%

86.10%

0.00%

15540

259

21

Host

/

DISPLAY=:0 ./GpuTest /test=gi /width=1600 /height=900 /benchmark

Host(:0)

100.00%

100.00%

87.10%

0.00%

15230

253

22

Container

GLX

DISPLAY=:1 vglrun -d egl ./GpuTest /test=gi /width=1600 /height=900 /benchmark

Container(:1)

800%

96.00%

0.00%

280%

14816

246

23

Container

GLX

DISPLAY=:1 vglrun -d egl ./GpuTest /test=gi /width=1600 /height=900 /benchmark

Container(:1)

800%

97.00%

0.00%

280%

14838

247

24

Container

GLX

DISPLAY=:1 vglrun -d egl ./GpuTest /test=gi /width=1600 /height=900 /benchmark

Container(:1)

79.00%

97.00%

0.00%

200%

14788

246

25

Container

EGL

DISPLAY=:1 vglrun -d egl ./GpuTest /test=gi /width=1600 /height=900 /benchmark

Container(:1)

80.00%

97.00%

0.00%

200%

14814

246

26

Container

EGL

DISPLAY=:1 vglrun -d egl ./GpuTest /test=gi /width=1600 /height=900 /benchmark

Container(:1)

78.00%

97.00%

0.00%

200%

14828

247

27

Container

EGL

DISPLAY=:1 vglrun -d egl ./GpuTest /test=gi /width=1600 /height=900 /benchmark

Container(:1)

79.00%

100.00%

0.00%

20.80%

14819

246

28

Container

EGL

DISPLAY=:1 vglrun -d :0 ./GpuTest /test=gi /width=1600 /height=900 /benchmark

Container(:1)

78.00%

99.00%

0.00%

24.80%

14739

245

29

Container

EGL

DISPLAY=:1 vglrun -d :0 ./GpuTest /test=gi /width=1600 /height=900 /benchmark

Container(:1)

77.00%

100.00%

0.00%

280%

14699

244

30

Container

EGL

DISPLAY=:1 vglrun -d :0 ./GpuTest /test=gi /width=1600 /height=900 /benchmark

Container(:1)

79.00%

100.00%

0.00%

24.80%

14625

243

测试结果示例:

image.png

GravityMark测试结果

编号

测试位置

Xfce4 Backend

使用VirtualGL

API

Asteroids

GPU

使用率

GravityMark

CPU使用率

Xorg CPU

使用率

Xvnc CPU

使用率

得分

FPS

每帧时间(ms)

31

Host

/

Vulkan

1000000

98.0%

0%

48.0%

0.0%

10408

63

16.051

32

Host

/

Vulkan

200000

90%

7.0%

36.0%

0.0%

29705

177.9

5.621

33

Host

/

OpenGL

1000000

100.0%

100.0%

28.7%

0.0%

2963

17.7

56.497

34

Host

/

OpenGL

200000

100.0%

94.1%

68.3%

0.0%

19659

117.7

8.496

35

Container

EGL

Vulkan

1000000

87.0%

97.0%

0%

19.8%

10217

62

16.340

36

Container

EGL

Vulkan

200000

70%

90%

0%

29.7%

24312

145.6

6.868

37

Container

EGL

OpenGL

1000000

99.0%

100.0%

0%

10.0%

3046

18.2

54.945

38

Container

EGL

OpenGL

200000

90%

100%

20.8%

19.8%

18659

117

8.953

 

 

GravityMark的其他设置如下:

∙        Render: Default

∙        Antialiasing: Default(Temporal)

∙        Resolution: 1600x900

∙        LOD Bias: Default

测试结果示例:

image.png

测试结果分析及结论

以下分别针对OpenGLVulkan测试结果进行分析。

OpenGL性能

1)     使用TurboVNC比使用Xorg作为2D X Server性能更好

测试2对比34对比56对比78对比911对比1213对比1415对比1617对比18,可以得出结论,VirtualGL将画面输出到TurboVNC相比输出到Host上的Xorg,性能显著更好,GPU占用率也更低,这是得益于TurboVNC的优化;

2)     使用TurboVNC作为2D X Server时,EGL BackendGLX Backend的性能差距非常小

测试252627对比测试282930显示,使用TurboVNC作为2D X Server时,EGL BackendGLX Backend性能差距非常小,约为2%以内;

3)     TurboVNC启动Xfce4时使用的Backend对性能几乎没有影响

测试3对比75对比912对比1614对比18,可以得出结论,TurboVNC启动Xfce4时使用的Backend(即TVNC_VGLRUN环境变量设置的Backend)对性能几乎没有影响;

4)     GPU测试软件测试过程中帧率非常高时,VirtualGL给测试软件带来的结果波动很大;当帧率接近实际使用场景时,VirtualGL带来的损耗非常小;

测试110对比其他测试,可以看到,使用VirtualGL时,最好的性能也只有不使用VirtualGL时的18%,对于这个性能损耗,VirtualGL作者在Github Issues(Performance loose?Slow performance without ssh (same machine))中有解释,glmark2测试显示的性能损耗主要来自于VirtualGL引入的framebuffer read backglxgearsglmark2GPU测试软件的主要原理是,渲染大量的三角形,并测试GPU的极限渲染帧率,而VirtualGL需要在应用程序完成一帧渲染的时候,回读framebuffer,并(通过TurboVNC)传输给客户端显示,因此导致了极限帧率的巨大下降。glmark2测试过程中的部分日志如下:

Host上直接运行glmark2时:

root@aliyun:/etc/X11# glmark2
=======================================================
glmark2 2014.03+git2015061fa71af2d
=======================================================
OpenGL Information
GL_VENDOR: NVIDIA Corporation
GL_RENDERER: NVIDIA A10/PCIe/SSE2
GL_VERSION: 4.6.0 NVIDIA 470.801
=======================================================
[build] use-vbo=false: FPS: 9187 FrameTime: 0.109 ms
=======================================================
glmark2 Score: 11350 
=======================================================

Container中通过VirtualGL运行glmark2时:

root@desktop2-glx:/home# DISPLAY=:1 vglrun -d egl0 glmark2
=======================================================
glmark2 2014.03+git2015061fa71af2d
=======================================================
OpenGL Information
GL_VENDOR: NVIDIA Corporation
GL_RENDERER: NVIDIA A10/PCIe/SSE2
GL_VERSION: 4.6.0 NVIDIA 470.801
=======================================================
[build] use-vbo=false: FPS: 1442 FrameTime: 0.693 ms
=======================================================
glmark2 Score: 1837 
=======================================================

可以看到,VirtualGL导致每帧的时间从0.109ms增加到了0.693ms,因此引起了结果的巨大降低,但是,增加的时间对普通应用来说,是微不足道的,普通应用的刷新率通常为60Hz,每帧时间的最大值可以达到16.67msVirtualGL增加的这部分时间(0.584ms)相对于16.67ms是非常小的。

测试38对比34,可以看到,在FPS110左右时,VirtualGL带来的损耗约为5%(1-117/117.7);测试37对比33,可以看到,当帧率非常低时,VirtualGL带来的性能损耗被淹没在帧率本身的波动中了,甚至出现了使用VirtualGL比不使用VirtualGL性能更好的情况;

Vulkan性能

测试35对比31显示,当FPS60左右时,VirtualGL带来的Vulkan性能损耗在2%以内(1-62/63);测试36对比32显示,在FPS150左右时,VirtualGL带来的Vulkan性能损耗约为18%(1-145.6/177.9)

总体结论:

Multiseat方案配置复杂,受硬件限制较大,不适合作为产品方案。

XephyrXpra方案由于没有GPU加速,也不适合作为产品方案。

使用VirtualGL方案,可以很好地在阿里云异构实例上实现Linux桌面多开,多开的桌面之间互不影响,多个用户可分别使用VNC客户端连接自己的桌面运行业务软件。VirtualGL会给渲染的每一帧增加耗时,但是,在通常使用场景(刷新率60Hz)下,VirtualGL带来的OpenGLVulkan开销均在5%以内。

VirtualGL使用EGL Backend时,还可以不依赖于X11 ServerHost上只需要安装显卡驱动,无需额外软件,部署非常方便。

此外需要注意的是,由于TurboVNC在启动的时候设置了独立的dbus session并自动拉起了启动桌面环境,虽然本文是在一个容器中启动一个桌面,并不意味着桌面和容器是一一对应的,用户如果对桌面以及业务软件之间的安全隔离性没有要求,完全可以在一个容器中,或者直接在Host环境上,多次运行以下命令来    开启多个独立的xfce桌面:

export TVNC_VGLRUN="vglrun -d egl0 +wm" /opt/TurboVNC/bin/vncserver -wm xfce -vgl -geometry 1920x1080 -depth 24

Linux桌面多开最佳实践

Linux桌面多开最佳方案为VirtualGL方案(配合使用TurboVNC)。

对于VirtualGL方案,由于使用GLX Backend需要将HostX11 socket目录(/tmp/.X11-unix)映射到容器中,多个容器同时使用时,有潜在的冲突风险和安全风险,因此,建议参考5.2使用EGL BackendHost上只需要安装NVIDIA驱动,相关设置都在容器中,方便备份和迁移。

如果用户业务软件在渲染时,不需要实时显示,软件会将最终结果输出到文件,那么,可以在运行软件的时候设置"VGL_READBACK=none"以获得最好的性能,命令示例:

DISPLAY=:1 VGL_READBACK=none vglrun -d egl0 glmark2

设置"VGL_READBACK=none"后,应用软件的窗口是黑屏,VirtualGLframebuffer read back引入的性能影响将会被消除。

相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
5天前
|
Linux 开发工具 C语言
Linux 安装 gcc 编译运行 C程序
Linux 安装 gcc 编译运行 C程序
24 0
|
18天前
|
监控 Unix Linux
Linux操作系统调优相关工具(四)查看Network运行状态 和系统整体运行状态
Linux操作系统调优相关工具(四)查看Network运行状态 和系统整体运行状态
31 0
|
26天前
|
Linux
Linux中centos桌面消失网络图标
Linux中centos桌面消失网络图标
13 0
|
18天前
|
Linux
Linux操作系统调优相关工具(三)查看IO运行状态相关工具 查看哪个磁盘或分区最繁忙?
Linux操作系统调优相关工具(三)查看IO运行状态相关工具 查看哪个磁盘或分区最繁忙?
21 0
|
4天前
|
存储 监控 中间件
Linux双机热备解决方案之Heartbeat
Linux双机热备解决方案之Heartbeat
|
5天前
|
Ubuntu Linux 开发工具
WSL2(3)安装Linux headers完美解决方案
WSL2(3)安装Linux headers完美解决方案
5 0
|
25天前
|
Ubuntu Unix Linux
【Linux/Ubuntu】Linux/Ubuntu运行python脚本
【Linux/Ubuntu】Linux/Ubuntu运行python脚本
|
25天前
|
Linux
Linux驱动运行灯 Heartbeat
Linux驱动运行灯 Heartbeat
12 0
|
26天前
|
Linux 测试技术 C语言
【Linux】应用编程之C语言文件操作
【Linux】应用编程之C语言文件操作
|
26天前
|
Java Linux
Linux运行jar并选择配置文件
Linux运行jar并选择配置文件
8 1