AIGC引爆泛娱乐内容生产革命
2023年,AIGC的潮流引爆了泛娱乐内容的生产力革命。文生图、文生音频、文生视频等AIGC范式成为了各大公司争相投入和落地生产的主要场景。目前AIGC领域主要分为两个大的场景,一个是面向终端客户的场景,例如:Midjourney或者Hugging Face;另外一个是面向内容生产者的场景,例如:Stable Diffusion。前置更多的是面向AIGC的服务化与商业化,而后者更多的面向企业内部数字资产生成与提效。
游戏行业是AIGC领域发展最迅速的行业,大部分头部的游戏公司会对内提供AIGC引擎能力加速游戏策划、游戏运营、原画生产、模型生产的提效。这种面向企业内部终端客户的使用场景是本文重点讨论的场景。
相比传统的互联网型业务而言,AIGC引擎的使用与运维具有如下特性:
- 运行时间碎片且弹性
通常 AIGC引擎的使用时间与内容生产者的使用周期是强相关的。因为目前为止,AIGC引擎生成内容的质量需要人进行评估与交互式的调整。这会导致从单个内容生产者的角度而言,使用的时间会非常碎片,而且使用的时间周期性区间会非常确定。一般情况下,只有在工作日的4-6个小时间时AIGC引擎集中使用的时间,而有效的使用时长会更短暂,工作日的晚上与双休日正常情况下也是没有任何使用时长的。 - 数字资产隔离与安全
对于很多以内容生产为主体的行业与公司而言,AIGC引擎中的自训练模型是数字核心资产。不同的内容生产者之间是非主动不自动共享模型的。而且不同的内容生产者之间,生成的内容需要做到访问隔离、防止篡改、数据隔离。 - 多种资源类型与弹性
AIGC引擎对GPU的异构算力是强依赖。但是,GPU的种类丰富,不同类型的GPU在成本和效率上的差异非常大。以Stable Diffusion为例,A100 40G显存与A100 80G显存在生成图片的效率上相差1s左右,但是成本上会相差1倍以上。此外,很多早期就涉足AIGC的公司在本地机房中都会有比较多的消费卡(例如:NV3090)。在企业内部落地AIGC引擎的时候,需要考虑如何将这些资源利用起来,并统一管理和提效。 - 引擎种类与版本繁多
AIGC引擎的迭代速度非常快,不同版本之间会存在一定的不兼容。而作为数字资产生成的工具,通常为了保障模型的稳定运行,一旦投入生产,大部分时间不会轻易变更版本。而不同的内容生产者之间依赖的版本极有可能也会有所不同。所以,多个版本如何统一的管理和升级,也是企业内部落地AIGC的时候需要考虑的事情。
开源云原生AIGC工作台(AIGC-Gateway)
为了解决企业内部落地AIGC引擎的通用性问题,阿里云与行者AI通过CloudNativeGame社区一起开源了AIGC-Gateway项目,降低企业内部AIGC落地的难度与费用,真正做到开箱即用,即开即用。
AIGC-Gateway整体架构如下:
AIGC-Gateway具有如下特性:
- 动态拉起按需释放
对于任意一种AIGC引擎,AIGC-Gateway都可以做到,访问的时候拉起引擎,退出或者离开的时候,释放引擎所需的GPU资源,并保留数据存储。当下一次同一个用户访问的时候,快速拉起新的资源并挂载归属于这个客户的数据存储,实现GPU卡的分时复用,降低整体的成本投入。
租户独享访问隔离
通过AIGC-Gateway拉起的AIGC引擎资源独享,数据隔离。除此之外,访问地址通过OIDC的方式进行了安全防护,对任意一种AIGC引擎都可以无侵入式地实现访问的权限控制。此外,AIGC-Gateway通过与开源认证体系Logto的集成,实现了企业内部账号体系的自动单点登录与认证。统一GPU资源管理
AIGC-Gateway是一个与云厂商无关的开源项目,支持企业的IT工程师进行本地部署、混合云部署、多云部署。对于不同类型的GPU资源,例如:本地GPU、云上单卡GPU、云上多卡GPU、云上显存共享GPU都有完善的支持。版本/模型统一管理
AIGC-Gateway支持同时部署多种、多套、多版本的AIGC引擎。并且,可以对同一个版本的AIGC疫情进行简单便捷的批量管理。并且支持在不同版本的AIGC引擎进行数据的迁移与切换。成本核算与费用分摊
在阿里云上,可以通过可视化大盘和API的方式,实现组户级、实例级使用成本的核算,便于内部的成本核算以及成本单价的估算。
AIGC-Gateway是一个完全开源的项目,开发者可以在自己的IDC、云上(阿里云/多云)使用,也欢迎更多的开发者可以参与到AIGC-Gateway的项目贡献中。
AIGC-Gateway项目与CloudNativeGame社区
AIGC-Gateway项目发起的初衷,就不得不提一下所属的CloudNativeGame社区。CloudNativeGame社区是阿里云协同国内一线的游戏公司(龙渊、鹰角、B站、莉莉丝等)共同建立的游戏开源社区,旨在分享游戏行业在云原生领域的最佳实践,将通用性的需求与场景,通过开源项目的方式共享给游戏行业,让云原生技术可以真正成为游戏行业复苏的发动机。目前CloudNativeGame已经开源了三个不同项目:
- 云原生游戏工作负载 - kruise-game
- 模拟游戏开服时间工具 - fake-time-injector
- 开源云原生AIGC工作台 - aigc-gateway
非常希望越来越多的游戏开发者可以参与到CloudNativeGame社区,让云原生游戏的生态可以越来越丰富。