阿里云大数据Al技术

2024-05-15

【AAAI 2024】MuLTI：高效视频与语言理解

多模态理解模型具有广泛的应用，比如多标签分类、视频问答（videoQA）和文本视频检索等。现有的方法已经在视频和语言理解方面取得了重大进展，然而，他们仍然面临两个巨大的挑战：无法充分的利用现有的特征；训练时巨大的GPU内存消耗。我们提出了MuLTI，这是一种高度准确高效的视频和语言理解模型，可以实现高效有效的特征融合和对下游任务的快速适应。本文详细介绍基于MuLTI实现高效视频与语言理解。

阿里云大数据Al技术

77,687

橙鲤

2024-05-15

165

如何在数字世界复刻一个高还原、高拟真的“你”

通过阿里云智能媒体服务IMS完成数字人形象训练、人声克隆定制，并使用Timeline实现视频合成及创作，打造一个“声形俱佳”的数字分身。

橙鲤

165

百宝

2024-05-15

285

ECS多场景迁移上云最佳实践

阿里云弹性计算团队十三位产品专家和技术专家共同分享云上运维深度实践，详细阐述如何利用CloudOps工具实现运维提效、弹性降本。

百宝

285

ModelScope

2024-05-15

165

用消费级显卡微调属于自己的Agent

本文为魔搭社区轻量级训练推理工具SWIFT微调实战教程系列

ModelScope

165

ModelScope

2024-05-15

333

适合假期自学一战成名的必看秘籍-五板斧打造AgentScope应用

本文写给有一定编程基础的学习者，得以入门源码级开发Agentscope应用，并上线创空间，参加AgentScope的应用开发挑战赛。

ModelScope

333

CloudImagine

2024-07-05

53

泛娱乐出海Plus时代，音视频能力基座与时俱进

泛娱乐的音视频技术随着出海在演进，交互和内容的技术是内核，也在融合。

CloudImagine

53

房子韩

2023-09-08

367

阿里云智能媒体服务IMS在视频剪辑中花式抠图的代码实操与案例详述

本文介绍阿里云智能媒体服务IMS，围绕视频剪辑及数字人训练中的抠图需求，如何运用绿幕抠图、实景抠图能力，实现高效、便捷的视频制作及合成体验。

房子韩

367

元乙

2024-05-15

61166

面向全栈可观测的分布式链路追踪

全栈可观测App提供了一套完整的分析工具，从数据统计分析能力到数据关联，再到具备智能化和自动化特性的相关工具，以解决人们在可观测性方面所遇到的问题。未来，我们将持续提供更加丰富和强大的分析工具来满足用户的需求。

元乙

61,166

探索云世界

2024-05-15

2369

阿里云大降价后，再谈“降本增效”

2024年2月29日，阿里云宣布史上最大力度降价，引发行业对用云成本的热议。

探索云世界

2,369

类目筛选

内容类型

【AAAI 2024】MuLTI：高效视频与语言理解

如何在数字世界复刻一个高还原、高拟真的“你”

ECS多场景迁移上云最佳实践

用消费级显卡微调属于自己的Agent

适合假期自学一战成名的必看秘籍-五板斧打造AgentScope应用

泛娱乐出海Plus时代，音视频能力基座与时俱进

阿里云智能媒体服务IMS在视频剪辑中花式抠图的代码实操与案例详述

面向全栈可观测的分布式链路追踪

阿里云大降价后，再谈“降本增效”