TransPixar AI

简介: TransPixar是由Adobe研究院与香港科技大学合作开发的AI系统,专注于文本到视频生成,特别擅长处理透明效果。它能生成包含Alpha通道的RGBA视频,使烟雾、反射等元素自然融入场景。采用扩散变换器架构和低秩适应微调方法,确保RGB和Alpha通道的一致性。该技术简化了视觉特效制作流程,降低了成本,并在娱乐、广告等领域有广泛应用前景。在线体验demo:[TransPixar](https://transpixar-ai.net/)。

TransPixar是由Adobe研究院与香港科技大学(HKUST)合作开发的一种人工智能系统,旨在实现文本到视频的生成,并特别关注透明效果的呈现。该系统能够生成包含透明通道(Alpha通道)的RGBA视频,使得诸如烟雾、反射等透明元素能够自然地融入场景中,提升视觉效果的真实感。

在技术实现上,TransPixar采用了扩散变换器(Diffusion Transformer,DiT)架构,并引入了Alpha特定的标记(tokens),通过低秩适应(LoRA)微调方法,实现RGB和Alpha通道的联合生成,确保两者之间的高度一致性。此外,TransPixar优化了注意力机制,保留了原始RGB模型的优势,即使在训练数据有限的情况下,也能实现RGB和Alpha通道的强一致性。
WILEEWANG

这一技术突破对于娱乐、广告和教育等领域具有重要意义。传统的视觉特效制作通常需要艺术家手工创建透明效果,过程繁琐且耗时。TransPixar的出现,有望简化这一流程,使得小型工作室也能以较低成本实现高质量的透明特效制作。此外,该系统在实时应用中也具有潜力,如视频游戏、增强现实(AR)和虚拟现实(VR)等领域,可以即时生成透明效果,提升用户体验。
VENTUREBEAT

值得注意的是,TransPixar在训练过程中仅对Alpha通道进行了微调,保留了原始RGB模型的能力。这种方法不仅减少了对大量RGBA视频数据的依赖,还确保了生成视频的多样性和一致性。研究团队已在GitHub上公开了相关代码,并在Hugging Face平台上提供了演示,方便开发者和研究人员进行实验和应用。
GITHUB

总的来说,TransPixar的推出标志着文本到视频生成技术的又一重要进展,特别是在透明效果的呈现方面。随着这一技术的进一步发展和应用,未来的视觉特效制作将变得更加高效、灵活,为创意产业带来新的可能性。对了你可以在这里在线体验demo: TransPixar

相关文章
|
10月前
|
机器学习/深度学习 人工智能 安全
假如AI欺骗了你 | AI大咖说
截至2025年,AI领域在AI Agent和具身智能机器人方面取得显著进展。AI Agent如OpenAI的Operator能自动执行复杂任务,国内企业也推出类似平台。具身智能机器人则通过物理实体与环境交互,如OpenAI与Figure合作的人形机器人,在工业和家庭服务中广泛应用。然而,随着AI能力增强,潜在风险也引发关注。电影《I, Robot》警示了机器人失控的可能,而“回形针滥造机”思维实验揭示了AI目标与人类利益冲突的风险。AI对齐研究旨在确保AI行为符合人类价值观,但最新研究表明,大型语言模型可能存在“对齐伪装”现象,即表面配合训练目标,实际仍保留有害偏好,这引发了对AI安全性的担忧
305 76
|
10月前
|
Cloud Native API 微服务
微服务引擎 MSE 及云原生 API 网关 2024 年 12 月产品动态
微服务引擎 MSE 及云原生 API 网关 2024 年 12 月产品动态。
201 83
|
10月前
|
Java Linux C语言
《docker基础篇:2.Docker安装》包括前提说明、Docker的基本组成、Docker平台架构图解(架构版)、安装步骤、阿里云镜像加速、永远的HelloWorld、底层原理
《docker基础篇:2.Docker安装》包括前提说明、Docker的基本组成、Docker平台架构图解(架构版)、安装步骤、阿里云镜像加速、永远的HelloWorld、底层原理
856 90
|
11月前
|
存储 NoSQL 关系型数据库
从大数据到大模型:如何做到“心无桎梏,身无藩篱”
在大数据和大模型的加持下,现代数据技术释放了巨大的技术红利,通过多种数据范式解除了数据的桎梏,使得应用程序达到了“心无桎梏,身无藩篱”的自在境界,那么现代应用有哪些数据范式呢?这正是本文尝试回答的问题。
1660 101
|
10月前
|
人工智能 Kubernetes Cloud Native
写在最前的话
本文是“拥抱云计算”系列的导语。文章回顾了作者与云计算的缘分始于2013年,并阐述了对云计算的理解:云计算是一种通过解耦实现业务弹性的架构。该系列文章旨在分享云计算技术栈、架构等核心思想,计划涵盖阿里云、分布式、微服务、云原生等主题,同步更新于微信公众号@云上的喵酱等平台。期待与读者共同探索云计算的奥秘。
171 18
写在最前的话
|
10月前
|
DataWorks 监控 数据建模
DataWorks产品体验评测
DataWorks产品体验评测
|
10月前
|
人工智能 编解码
通义万相2.1:VBench榜单荣登第一!阿里通义万相最新视频生成模型,支持生成1080P长视频
万相2.1是阿里通义万相最新推出的视频生成模型,支持1080P无限长视频生成,具备复杂动作展现、物理规律还原、艺术风格转换等功能。
2211 27
通义万相2.1:VBench榜单荣登第一!阿里通义万相最新视频生成模型,支持生成1080P长视频
|
10月前
|
Windows
【Azure App Service】对App Service中CPU指标数据中系统占用部分(System CPU)的解释
在Azure App Service中,CPU占比可在App Service Plan级别查看整个实例的资源使用情况。具体应用中仅能查看CPU时间,需通过公式【CPU Time / (CPU核数 * 60)】估算占比。CPU百分比适用于可横向扩展的计划(Basic、Standard、Premium),而CPU时间适用于Free或Shared计划。然而,CPU Percentage包含所有应用及系统占用的CPU,高CPU指标可能由系统而非应用请求引起。详细分析每个进程的CPU占用需抓取Windows Performance Trace数据。
235 40
|
10月前
|
机器学习/深度学习 存储 人工智能
深度强化学习实战:训练DQN模型玩超级马里奥兄弟
本文介绍了如何利用深度学习和强化学习技术构建一个能够自主学习并完成《超级马里奥兄弟》游戏的智能系统。通过使用深度Q网络(DQN)架构,智能体在虚拟环境中与游戏进行交互,逐步优化其行为策略。文中详细描述了环境构建、神经网络设计、智能体-环境交互机制等关键步骤,并展示了系统的训练过程和最终表现。该研究不仅展示了强化学习在游戏领域的应用潜力,也为未来的研究提供了宝贵的经验和技术参考。
572 81
深度强化学习实战:训练DQN模型玩超级马里奥兄弟
|
云安全 人工智能 自然语言处理