阿里云超算:弹性影视渲染方案实战

简介: 弹性高性能计算(E-HPC,https://ehpc.console.aliyun.com/ )基于阿里云基础设施,为用户提供一站式的公有云HPC服务。除了自动化整合IaaS层硬件资源为用户提供云上HPC集群外,E-HPC还致力于推出面向主流行业方向的定制化PaaS服务,帮助用户更方便地使用云上资源。

弹性高性能计算(E-HPC,https://ehpc.console.aliyun.com/ )基于阿里云基础设施,为用户提供一站式的公有云HPC服务。除了自动化整合IaaS层硬件资源为用户提供云上HPC集群外,E-HPC还致力于推出面向主流行业方向的定制化PaaS服务,帮助用户更方便地使用云上资源。渲染应用是典型的数字内容创作(DCC-DigitalContentCreation)HPC应用,相比于传统求解微分方程积分方程的仿真计算,DCC具备“完美任务并行”的特点。本文主要介绍阿里云超算E-HPC推出的弹性影视渲染方案。

影视渲染

场景介绍

画面渲染可分为两种,一种是3D游戏里的实时渲染(Real-time Rendering),另一种是动画电影常用到的离线渲染(Offline Rendering)。前者因为需要保证渲染速度而不得不在画质上做出妥协,后者则可以为了追求真实感而投入更高的成本。本文介绍的影视渲染场景属于离线渲染的范畴。

01e61fcd99a5c19ca178bdc44207488e_2

特征 优点 缺点 使用行业
离线渲染 美学和视觉效果展现,通过渲染后,最终展示给用户的电影/图片效果非常逼真,
电影/图片的细节,灯光可以做到非常的真实,用户无法辨别出是否是真实的
可以不考虑时间对渲染效果的影响 渲染画面播放时用户不用实时控制物体和场景 影视、动画、效果图、广告
实时渲染 交互性和实时性,其模型通常具有较少的细节,以提高绘制速度并减少滞后时间。
比起离线渲染,实时渲染更看重对现实世界各种现象的模拟和对数据的有效整合
可以实时操控 受系统的负荷能力的限制、必要时要牺牲画面效果 游戏、模拟物理测试

软件栈

影视渲染业务常用到的软件包括渲染管理系统和渲染引擎。渲染管理系统负责整合集群硬件资源、分发调度渲染任务,并为用户提供交互式操作界面,如Deadline;渲染引擎则负责渲染任务的求解,当前市面上的渲染引擎众多,认可度高的有RenderMan、V-Ray、Maya、Houdini等。
这里对渲染管理系统Deadline重点介绍一下。Deadline由著名的Frantic Films电影特效制作公司开发,面向Windows/Linux/MacOS系统,支持几乎所有的主流渲染引擎、2D和3D制作软件,和后端处理软件,并为每种渲染引擎提供简洁的作业提交模板。

22d2384b6b35847c950583501b9aa777

渲染管理系统Deadline包含3个必要组件。
Deadline Server:负责维护渲染数据仓库和渲染任务的分发,共享渲染参数比如渲染进度、报错信息等。考虑到需要为其他节点开放读写权限,通常安装在共享文件系统上。
Deadline Slave:定时上报节点/任务信息到数据仓库,部署在执行渲染任务的计算节点上,节点配置要求高。
Deadline Monitor:负责为用户提供交互式渲染操作界面,可以部署在集群头节点或图形节点上,通常对节点配置要求不高。

业务需求

海量计算需求:CG镜头渲染非常耗时,对节点配置要求高。通常一个纯CG影片渲染量以千万核时计,渲染高峰期通常会有数千台节点并行执行渲染任务。
存储性能需求:多帧读取资产文件很大概率是同一个,因此带来并发顺序读压力。同时媒资文件具有单文件较大(数百G),小文件(KB级别)众多的两极化特点,所以要考虑渲染进行中对存储设备的读写吞吐、IOPS压力。
IT资源利用需求:根据影片档期走,渲染有周期性特点,通常会有3-4个月的渲染高峰期。项目制特点导致制作期需要大规模渲染节点,而空档期服务器和软件license资源闲置。

自建IDC渲染vs公共云渲染

自建渲染集群 阿里云渲染
资源弹性 固定资产支出,无弹性 资源弹性,按使用量付费
服务器规格 机器配置固定,升级难度大 配置多样化,快速升降配,性能上限高
存储灾备 本地做RAID,实际存储利用率达不到100% 天然三备份,数据可靠性高
技术服务 用户自行运维 专业技术服务支持/企业钉钉群

E-HPC弹性影视渲染方案

阿里云超算深度集成业界主流渲染管理系统Deadline,结合EHPC当前功能特性,推出云上弹性影视渲染方案,帮助渲染用户灵活使用云上资源,提高渲染效率,降低上云成本。

  • 与阿里云IaaS计算资源互通,支持用户通过自定义镜像一键创建云上Deadline渲染集群;提供云图站/VNC等远程图形界面接入方式,兼容用户线下操作习惯。

2019531160610dama

  • 支持用户根据业务需求快速扩容云上多种计算实例规格;实时感知集群任务负载,支持集群规模的动态伸缩。

2019531160733dama

  • 提供云上性能分析引擎Cloudmetrics,全方位监测集群资源利用情况,为用户推荐最优的云平台配置。

ready_5

目录
相关文章
|
6月前
|
人工智能 网络性能优化 调度
Koordinator v1.6: 支持AI/ML场景的异构资源调度能力
如何高效管理和调度这些资源成为了行业关注的核心问题。在这一背景下,Koordinator积极响应社区诉求,持续深耕异构设备调度能力,并在最新的v1.6版本中推出了一系列创新功能,帮助客户解决异构资源调度难题。
|
24天前
|
机器学习/深度学习 人工智能 JSON
AI应用工程师面试问题清单
本内容涵盖AI与大语言模型(LLM)基础原理、Prompt工程设计及实战项目经验。详解LLM预测机制、Transformer架构、Embedding应用,介绍Prompt优化策略如Zero-shot、Few-shot、RAG技术,并结合实际项目展示AI应用全流程开发与落地能力。
289 4
|
人工智能 API C++
【AI绘画大比拼】通义万相VS文心一格:探索十种风格下的绘画生成差异!
近日,通义大模型家族的新成员——通义万相已在人工智能大会上亮相。其中,通义万相的强大的“文生图”功能,不禁让我想到了去年八月由百度依托飞桨、文心大模型的技术创新推出的“AI作画”首款产品——文心一格。 那么,在类似的Prompt下,两款产品的表现将会如何呢?今天就让我们就十种风格下二者生成图像的表现力,来看看这两款产品的差异。
|
缓存 云计算
这个夏天,追光动画在阿里云上“绘出”《长安三万里》
追光动画已和阿里云合作多年,从《阿唐奇遇》到《白蛇2:青蛇劫起》、《新神榜:杨戬》和这次的《长安三万里》等。
这个夏天,追光动画在阿里云上“绘出”《长安三万里》
|
域名解析 存储 网络协议
深入解析网络通信关键要素:IP 协议、DNS 及相关技术
本文详细介绍了IP协议报头结构及其各字段的功能,包括版本、首部长度、服务类型、总长度、标识、片偏移、标志、生存时间(TTL)、协议、首部检验和等内容。此外,还探讨了IP地址的网段划分、特殊IP地址的应用场景,以及路由选择的大致流程。最后,文章简要介绍了DNS协议的作用及其发展历史,解释了域名解析系统的工作原理。
430 5
深入解析网络通信关键要素:IP 协议、DNS 及相关技术
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
软件测试中的人工智能革命:提升测试效率与质量的新篇章
随着人工智能技术的不断成熟,其在软件测试领域的应用正逐渐改变传统测试方式。本文将探讨AI在软件测试中的应用现状、优势以及面临的挑战,并通过具体案例分析展示AI如何提高测试效率和质量。最后,我们将讨论未来AI在软件测试中的发展趋势及其对人类测试工程师角色的影响。
986 4
|
11月前
|
人工智能 云栖大会
阿里云产品九月刊来啦
阿里云全面投入升级AI大基建,全线产品年度重磅发布,更多详情请点击阿里云产品月刊2024云栖大会特刊
178 2
阿里云产品九月刊来啦
|
SQL Oracle 关系型数据库
SQL查询结果导出方法详析及实践指南
导出SQL查询结果是数据库管理中的一个重要环节。不同的数据库系统提供了各自的工具和方法来完成这项任务。选择合适的方法取决于具体的应用场景、数据规模和个人偏好。无论是在命令行中使用简单的SQL语句,还是通过GUI工具或编程语言实现自动化脚本,都有助于提高工作效率,简化数据管理流程。
|
弹性计算 监控 安全
5 分钟上手函数计算
在使用函数计算前,您需要开通函数计算服务。本场景中提供的阿里云子账号无函数计算服务操作权限,请使用您自己的阿里云账号操作。您无需担心扣费问题,因为函数计算服务有一定的免费额度。
30886 0
5 分钟上手函数计算

热门文章

最新文章