阿里云超算:弹性影视渲染方案实战

简介: 弹性高性能计算(E-HPC,https://ehpc.console.aliyun.com/ )基于阿里云基础设施,为用户提供一站式的公有云HPC服务。除了自动化整合IaaS层硬件资源为用户提供云上HPC集群外,E-HPC还致力于推出面向主流行业方向的定制化PaaS服务,帮助用户更方便地使用云上资源。

弹性高性能计算(E-HPC,https://ehpc.console.aliyun.com/ )基于阿里云基础设施,为用户提供一站式的公有云HPC服务。除了自动化整合IaaS层硬件资源为用户提供云上HPC集群外,E-HPC还致力于推出面向主流行业方向的定制化PaaS服务,帮助用户更方便地使用云上资源。渲染应用是典型的数字内容创作(DCC-DigitalContentCreation)HPC应用,相比于传统求解微分方程积分方程的仿真计算,DCC具备“完美任务并行”的特点。本文主要介绍阿里云超算E-HPC推出的弹性影视渲染方案。

影视渲染

场景介绍

画面渲染可分为两种,一种是3D游戏里的实时渲染(Real-time Rendering),另一种是动画电影常用到的离线渲染(Offline Rendering)。前者因为需要保证渲染速度而不得不在画质上做出妥协,后者则可以为了追求真实感而投入更高的成本。本文介绍的影视渲染场景属于离线渲染的范畴。

01e61fcd99a5c19ca178bdc44207488e_2

特征 优点 缺点 使用行业
离线渲染 美学和视觉效果展现,通过渲染后,最终展示给用户的电影/图片效果非常逼真,
电影/图片的细节,灯光可以做到非常的真实,用户无法辨别出是否是真实的
可以不考虑时间对渲染效果的影响 渲染画面播放时用户不用实时控制物体和场景 影视、动画、效果图、广告
实时渲染 交互性和实时性,其模型通常具有较少的细节,以提高绘制速度并减少滞后时间。
比起离线渲染,实时渲染更看重对现实世界各种现象的模拟和对数据的有效整合
可以实时操控 受系统的负荷能力的限制、必要时要牺牲画面效果 游戏、模拟物理测试

软件栈

影视渲染业务常用到的软件包括渲染管理系统和渲染引擎。渲染管理系统负责整合集群硬件资源、分发调度渲染任务,并为用户提供交互式操作界面,如Deadline;渲染引擎则负责渲染任务的求解,当前市面上的渲染引擎众多,认可度高的有RenderMan、V-Ray、Maya、Houdini等。
这里对渲染管理系统Deadline重点介绍一下。Deadline由著名的Frantic Films电影特效制作公司开发,面向Windows/Linux/MacOS系统,支持几乎所有的主流渲染引擎、2D和3D制作软件,和后端处理软件,并为每种渲染引擎提供简洁的作业提交模板。

22d2384b6b35847c950583501b9aa777

渲染管理系统Deadline包含3个必要组件。
Deadline Server:负责维护渲染数据仓库和渲染任务的分发,共享渲染参数比如渲染进度、报错信息等。考虑到需要为其他节点开放读写权限,通常安装在共享文件系统上。
Deadline Slave:定时上报节点/任务信息到数据仓库,部署在执行渲染任务的计算节点上,节点配置要求高。
Deadline Monitor:负责为用户提供交互式渲染操作界面,可以部署在集群头节点或图形节点上,通常对节点配置要求不高。

业务需求

海量计算需求:CG镜头渲染非常耗时,对节点配置要求高。通常一个纯CG影片渲染量以千万核时计,渲染高峰期通常会有数千台节点并行执行渲染任务。
存储性能需求:多帧读取资产文件很大概率是同一个,因此带来并发顺序读压力。同时媒资文件具有单文件较大(数百G),小文件(KB级别)众多的两极化特点,所以要考虑渲染进行中对存储设备的读写吞吐、IOPS压力。
IT资源利用需求:根据影片档期走,渲染有周期性特点,通常会有3-4个月的渲染高峰期。项目制特点导致制作期需要大规模渲染节点,而空档期服务器和软件license资源闲置。

自建IDC渲染vs公共云渲染

自建渲染集群 阿里云渲染
资源弹性 固定资产支出,无弹性 资源弹性,按使用量付费
服务器规格 机器配置固定,升级难度大 配置多样化,快速升降配,性能上限高
存储灾备 本地做RAID,实际存储利用率达不到100% 天然三备份,数据可靠性高
技术服务 用户自行运维 专业技术服务支持/企业钉钉群

E-HPC弹性影视渲染方案

阿里云超算深度集成业界主流渲染管理系统Deadline,结合EHPC当前功能特性,推出云上弹性影视渲染方案,帮助渲染用户灵活使用云上资源,提高渲染效率,降低上云成本。

  • 与阿里云IaaS计算资源互通,支持用户通过自定义镜像一键创建云上Deadline渲染集群;提供云图站/VNC等远程图形界面接入方式,兼容用户线下操作习惯。

2019531160610dama

  • 支持用户根据业务需求快速扩容云上多种计算实例规格;实时感知集群任务负载,支持集群规模的动态伸缩。

2019531160733dama

  • 提供云上性能分析引擎Cloudmetrics,全方位监测集群资源利用情况,为用户推荐最优的云平台配置。

ready_5

目录
相关文章
|
5月前
|
存储 UED
实时云渲染技术如何助力虚拟展厅?
实时云渲染技术如何助力虚拟展厅?
|
弹性计算 负载均衡 Serverless
直播平台源码弹性云托管技术:稳定直播与降低成本的利器
弹性云托管技术的出现与运用,为直播平台源码带来了重要的意义,在处理平台负载与成本优化等方面起到了重要的作用,为用户带去了优质的使用体验,将平台往更优质的方向推进。
直播平台源码弹性云托管技术:稳定直播与降低成本的利器
|
弹性计算 运维 监控
带你读《云原生架构白皮书2022新版》——爱奇艺体育:体验 Serverless 极致扩缩容,资源利用率提升 40%(下)
带你读《云原生架构白皮书2022新版》——爱奇艺体育:体验 Serverless 极致扩缩容,资源利用率提升 40%(下)
219 3
|
运维 监控 Kubernetes
带你读《云原生架构白皮书2022新版》——爱奇艺体育:体验 Serverless 极致扩缩容,资源利用率提升 40%(上)
带你读《云原生架构白皮书2022新版》——爱奇艺体育:体验 Serverless 极致扩缩容,资源利用率提升 40%(上)
260 2
|
运维 自然语言处理 监控
《阿里云云原生 Serverless 案例集》——典型案例——游戏-心动网络(TapTap)
《阿里云云原生 Serverless 案例集》——典型案例——游戏-心动网络(TapTap)
358 0
|
边缘计算 缓存 Kubernetes
OpenYurt v1.2 亮点速览丨云边流量峰值相比原生 K8s 降低 90%
北京时间 1 月 30 号发布的 OpenYurt v1.2.0 版本,社区呼声最高的几大特性终于落地,OpenYurt 的特点更加鲜明,主要特点包括:Kubernetes 无侵入,云边端全协同,可编程的资源访问控制,以及声明式云原生设备管理。
OpenYurt v1.2 亮点速览丨云边流量峰值相比原生 K8s 降低 90%
|
运维 Cloud Native 容器
【已结束】直播预告|传统 PvE 游戏 ∕ 开房间 PvP 游戏的云原生架构升级
【已结束】直播预告|传统 PvE 游戏 ∕ 开房间 PvP 游戏的云原生架构升级
|
Serverless
《Serverless 游戏场景实践-极致弹性解构在线游戏行业》电子版地址
Serverless 游戏场景实践-极致弹性解构在线游戏行业
108 0
《Serverless 游戏场景实践-极致弹性解构在线游戏行业》电子版地址
|
运维 自然语言处理 监控
serverless 案例 | 游戏 心动网络(TapTap)
serverless 案例 | 游戏 心动网络(TapTap)
225 0
serverless 案例 | 游戏 心动网络(TapTap)
|
机器学习/深度学习 XML 人工智能