阿里云大数据Al技术

2024-05-15

【AAAI 2024】MuLTI：高效视频与语言理解

多模态理解模型具有广泛的应用，比如多标签分类、视频问答（videoQA）和文本视频检索等。现有的方法已经在视频和语言理解方面取得了重大进展，然而，他们仍然面临两个巨大的挑战：无法充分的利用现有的特征；训练时巨大的GPU内存消耗。我们提出了MuLTI，这是一种高度准确高效的视频和语言理解模型，可以实现高效有效的特征融合和对下游任务的快速适应。本文详细介绍基于MuLTI实现高效视频与语言理解。

阿里云大数据Al技术

77,675

周宇睿

2023-09-08

464

MaxCompute半结构化数据思考与创新

本文将介绍MaxCompute在半结构化数据方面的一些思考与创新，围绕半结构化数据简析、传统方案优劣对比、MaxCompute半结构化数据解决方案、收益分析。

周宇睿

464

林以琳

2024-05-15

741

基于PAI-DSW快速启动Stable Diffusion WebUI

基于PAI-DSW快速启动Stable Diffusion WebUI，创作你的专属冬日主题AI画作！

林以琳

741

ModelScope

2024-05-15

208

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术

本文将以Yuan2.0最新发布的Februa模型为例进行测试验证，用更小规模的模型达到更好的效果。

ModelScope

208

阿里云云原生

2024-05-15

164915

OpenKruise v1.6 版本解读：增强多域管理能力

OpenKruise 在 2024.3 发布了最新的 v1.6 版本（ChangeLog），本文对新版本的核心特性做整体介绍。

阿里云云原生

164,915

房子韩

2023-09-08

363

阿里云智能媒体服务IMS在视频剪辑中花式抠图的代码实操与案例详述

本文介绍阿里云智能媒体服务IMS，围绕视频剪辑及数字人训练中的抠图需求，如何运用绿幕抠图、实景抠图能力，实现高效、便捷的视频制作及合成体验。

房子韩

363

赫曦

2024-05-15

92588

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

本文主要介绍了通过弹性，实现成本优化，解决集群资源利用率难题。

赫曦

92,588

ModelScope

2024-05-15

382

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

本期文章，我们会介绍一下AgentScope的一个设计哲学（Agent-oriented programming）

ModelScope

382

里戈

2023-10-26

158081

如何充分发挥 SQL 能力？

如何充分发挥 SQL 能力，是本篇文章的主题。本文尝试独辟蹊径，强调通过灵活的、发散性的数据处理思维，就可以用最基础的语法，解决复杂的数据场景。

里戈

158,081

类目筛选

内容类型

【AAAI 2024】MuLTI：高效视频与语言理解

MaxCompute半结构化数据思考与创新

基于PAI-DSW快速启动Stable Diffusion WebUI

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术

OpenKruise v1.6 版本解读：增强多域管理能力

阿里云智能媒体服务IMS在视频剪辑中花式抠图的代码实操与案例详述

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

如何充分发挥 SQL 能力？