阿里云超算:弹性影视渲染方案实战

简介: 弹性高性能计算(E-HPC,https://ehpc.console.aliyun.com/ )基于阿里云基础设施,为用户提供一站式的公有云HPC服务。除了自动化整合IaaS层硬件资源为用户提供云上HPC集群外,E-HPC还致力于推出面向主流行业方向的定制化PaaS服务,帮助用户更方便地使用云上资源。

弹性高性能计算(E-HPC,https://ehpc.console.aliyun.com/ )基于阿里云基础设施,为用户提供一站式的公有云HPC服务。除了自动化整合IaaS层硬件资源为用户提供云上HPC集群外,E-HPC还致力于推出面向主流行业方向的定制化PaaS服务,帮助用户更方便地使用云上资源。渲染应用是典型的数字内容创作(DCC-DigitalContentCreation)HPC应用,相比于传统求解微分方程积分方程的仿真计算,DCC具备“完美任务并行”的特点。本文主要介绍阿里云超算E-HPC推出的弹性影视渲染方案。

影视渲染

场景介绍

画面渲染可分为两种,一种是3D游戏里的实时渲染(Real-time Rendering),另一种是动画电影常用到的离线渲染(Offline Rendering)。前者因为需要保证渲染速度而不得不在画质上做出妥协,后者则可以为了追求真实感而投入更高的成本。本文介绍的影视渲染场景属于离线渲染的范畴。

01e61fcd99a5c19ca178bdc44207488e_2

特征 优点 缺点 使用行业
离线渲染 美学和视觉效果展现,通过渲染后,最终展示给用户的电影/图片效果非常逼真,
电影/图片的细节,灯光可以做到非常的真实,用户无法辨别出是否是真实的
可以不考虑时间对渲染效果的影响 渲染画面播放时用户不用实时控制物体和场景 影视、动画、效果图、广告
实时渲染 交互性和实时性,其模型通常具有较少的细节,以提高绘制速度并减少滞后时间。
比起离线渲染,实时渲染更看重对现实世界各种现象的模拟和对数据的有效整合
可以实时操控 受系统的负荷能力的限制、必要时要牺牲画面效果 游戏、模拟物理测试

软件栈

影视渲染业务常用到的软件包括渲染管理系统和渲染引擎。渲染管理系统负责整合集群硬件资源、分发调度渲染任务,并为用户提供交互式操作界面,如Deadline;渲染引擎则负责渲染任务的求解,当前市面上的渲染引擎众多,认可度高的有RenderMan、V-Ray、Maya、Houdini等。
这里对渲染管理系统Deadline重点介绍一下。Deadline由著名的Frantic Films电影特效制作公司开发,面向Windows/Linux/MacOS系统,支持几乎所有的主流渲染引擎、2D和3D制作软件,和后端处理软件,并为每种渲染引擎提供简洁的作业提交模板。

22d2384b6b35847c950583501b9aa777

渲染管理系统Deadline包含3个必要组件。
Deadline Server:负责维护渲染数据仓库和渲染任务的分发,共享渲染参数比如渲染进度、报错信息等。考虑到需要为其他节点开放读写权限,通常安装在共享文件系统上。
Deadline Slave:定时上报节点/任务信息到数据仓库,部署在执行渲染任务的计算节点上,节点配置要求高。
Deadline Monitor:负责为用户提供交互式渲染操作界面,可以部署在集群头节点或图形节点上,通常对节点配置要求不高。

业务需求

海量计算需求:CG镜头渲染非常耗时,对节点配置要求高。通常一个纯CG影片渲染量以千万核时计,渲染高峰期通常会有数千台节点并行执行渲染任务。
存储性能需求:多帧读取资产文件很大概率是同一个,因此带来并发顺序读压力。同时媒资文件具有单文件较大(数百G),小文件(KB级别)众多的两极化特点,所以要考虑渲染进行中对存储设备的读写吞吐、IOPS压力。
IT资源利用需求:根据影片档期走,渲染有周期性特点,通常会有3-4个月的渲染高峰期。项目制特点导致制作期需要大规模渲染节点,而空档期服务器和软件license资源闲置。

自建IDC渲染vs公共云渲染

自建渲染集群 阿里云渲染
资源弹性 固定资产支出,无弹性 资源弹性,按使用量付费
服务器规格 机器配置固定,升级难度大 配置多样化,快速升降配,性能上限高
存储灾备 本地做RAID,实际存储利用率达不到100% 天然三备份,数据可靠性高
技术服务 用户自行运维 专业技术服务支持/企业钉钉群

E-HPC弹性影视渲染方案

阿里云超算深度集成业界主流渲染管理系统Deadline,结合EHPC当前功能特性,推出云上弹性影视渲染方案,帮助渲染用户灵活使用云上资源,提高渲染效率,降低上云成本。

  • 与阿里云IaaS计算资源互通,支持用户通过自定义镜像一键创建云上Deadline渲染集群;提供云图站/VNC等远程图形界面接入方式,兼容用户线下操作习惯。

2019531160610dama

  • 支持用户根据业务需求快速扩容云上多种计算实例规格;实时感知集群任务负载,支持集群规模的动态伸缩。

2019531160733dama

  • 提供云上性能分析引擎Cloudmetrics,全方位监测集群资源利用情况,为用户推荐最优的云平台配置。

ready_5

目录
相关文章
|
数据采集 人工智能 自然语言处理
3分钟采集134篇AI文章!深度解析如何通过阿里云无影AgentBay实现25倍并发 + LlamaIndex智能推荐
结合阿里云无影 AgentBay 云端并发采集与 LlamaIndex 智能分析,3分钟高效抓取134篇 AI Agent 文章,实现 AI 推荐、智能问答与知识沉淀,打造从数据获取到价值提炼的完整闭环。
954 0
|
SQL Java 数据库
【MybatisPlus】MP的分页查询、多条件查询以及查询过程中解决null的空值判定
分页查询、多条件查询以及查询过程中解决null的空值判定
2180 0
【MybatisPlus】MP的分页查询、多条件查询以及查询过程中解决null的空值判定
|
机器学习/深度学习 人工智能 自然语言处理
软件测试中的人工智能革命:提升测试效率与质量的新篇章
随着人工智能技术的不断成熟,其在软件测试领域的应用正逐渐改变传统测试方式。本文将探讨AI在软件测试中的应用现状、优势以及面临的挑战,并通过具体案例分析展示AI如何提高测试效率和质量。最后,我们将讨论未来AI在软件测试中的发展趋势及其对人类测试工程师角色的影响。
1305 4
|
SQL Oracle 关系型数据库
SQL查询结果导出方法详析及实践指南
导出SQL查询结果是数据库管理中的一个重要环节。不同的数据库系统提供了各自的工具和方法来完成这项任务。选择合适的方法取决于具体的应用场景、数据规模和个人偏好。无论是在命令行中使用简单的SQL语句,还是通过GUI工具或编程语言实现自动化脚本,都有助于提高工作效率,简化数据管理流程。
|
11月前
|
人工智能 网络性能优化 调度
Koordinator v1.6: 支持AI/ML场景的异构资源调度能力
如何高效管理和调度这些资源成为了行业关注的核心问题。在这一背景下,Koordinator积极响应社区诉求,持续深耕异构设备调度能力,并在最新的v1.6版本中推出了一系列创新功能,帮助客户解决异构资源调度难题。
|
缓存 云计算
这个夏天,追光动画在阿里云上“绘出”《长安三万里》
追光动画已和阿里云合作多年,从《阿唐奇遇》到《白蛇2:青蛇劫起》、《新神榜:杨戬》和这次的《长安三万里》等。
这个夏天,追光动画在阿里云上“绘出”《长安三万里》
|
存储 数据处理 数据中心
1U和2U服务器应如何正确选择?各有什么优缺点?
标准机架式服务器以U为高度单位,1U和2U服务器各有优缺点。1U服务器体积小、性价比高,但扩展性和散热性较差;2U服务器扩展性好、散热佳、稳定性强,但托管费用较高。不同高度的服务器适用于不同的业务场景,选择时需根据具体需求决定。未来数据中心将根据业务特性选择合适的服务器类型,而非统一采用2U服务器。
448 2
|
Java
Jstack 查看线程状态及定位占用 cpu 较高的 java 线程
Jstack 查看线程状态及定位占用 cpu 较高的 java 线程
1492 2
|
人工智能 JSON Serverless
AI “黏土画风”轻松拿捏,手把手带你云端部署 ComfyUI
ComfyUI 是一款基于节点工作流稳定扩散算法的全新 WebUI,相对于传统的 WebUI,ComfyUI 的部署和学习曲线较陡峭,函数计算基于 Serverless 应用中心开发“ComfyUI 应用模版”,简化开发者的部署流程,帮助简单、快捷实现全新而精致的绘画体验,点击本文查看一键部署 ComfyUI 的方法。
20363 7
|
XML 人工智能 JSON