官方博客-第23页-阿里云开发者社区

阿里云大数据Al技术

2024-05-15

78239

【AAAI 2024】MuLTI：高效视频与语言理解

多模态理解模型具有广泛的应用，比如多标签分类、视频问答（videoQA）和文本视频检索等。现有的方法已经在视频和语言理解方面取得了重大进展，然而，他们仍然面临两个巨大的挑战：无法充分的利用现有的特征；训练时巨大的GPU内存消耗。我们提出了MuLTI，这是一种高度准确高效的视频和语言理解模型，可以实现高效有效的特征融合和对下游任务的快速适应。本文详细介绍基于MuLTI实现高效视频与语言理解。

阿里云大数据Al技术

78,239

ModelScope

2024-05-15

520

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

近日，元象发布其首个Moe大模型 XVERSE-MoE-A4.2B，采用混合专家模型架构（Mixture of Experts），激活参数4.2B，效果即可媲美13B模型。该模型全开源，无条件免费商用，支持中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用，推动低成本部署。

ModelScope

520

言澈

2024-05-15

1468

全景剖析阿里云容器网络数据链路（三）—— Terway ENIIP

本文是[全景剖析容器网络数据链路]第三部分，主要介绍Kubernetes Terway ENIIP模式下，数据面链路的转转发链路。

言澈

1,468

言澈

2024-05-15

1140

全景剖析阿里云容器网络数据链路（六）—— ASM Istio

本文是[全景剖析容器网络数据链路]第六部分部分，主要介绍ASM Istio模式下，数据面链路的转转发链路。

言澈

1,140

阿里云实时数仓Hologres

2024-05-15

75070

大数据分析平台之 OLAP 架构的最佳实践

本文将分享聚水潭云原生 OLAP 架构的最佳实践。

阿里云实时数仓Hologres

75,070

阿里云瑶池数据库

2024-08-13

782

7倍性能提升｜阿里云AnalyticDB Spark向量化能力解析

AnalyticDB Spark如何通过向量化引擎提升性能？

阿里云瑶池数据库

782

明巍临城水德

2024-11-14

541

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

在本文中，作者介绍了 Lingma SWE-GPT，一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

明巍临城水德等

541

殳玄

2025-01-16

1030

现身说法，AI小白的大模型学习路径

写这篇文章的初衷：作为一个AI小白，把我自己学习大模型的学习路径还原出来，包括理解的逻辑、看到的比较好的学习材料，通过一篇文章给串起来，对大模型建立起一个相对体系化的认知，才能够在扑面而来的大模型时代，看出点门道。

殳玄

1,030

亦达

2025-02-20

726

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

726

官方博客-第23页-阿里云开发者社区

类目筛选

内容类型

【AAAI 2024】MuLTI：高效视频与语言理解

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

全景剖析阿里云容器网络数据链路（三）—— Terway ENIIP

全景剖析阿里云容器网络数据链路（六）—— ASM Istio

大数据分析平台之 OLAP 架构的最佳实践

7倍性能提升｜阿里云AnalyticDB Spark向量化能力解析

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

现身说法，AI小白的大模型学习路径

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

官方博客-第23页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

【AAAI 2024】MuLTI：高效视频与语言理解

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

全景剖析阿里云容器网络数据链路（三）—— Terway ENIIP

全景剖析阿里云容器网络数据链路（六）—— ASM Istio

大数据分析平台之 OLAP 架构的最佳实践

7倍性能提升｜阿里云AnalyticDB Spark向量化能力解析

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

现身说法，AI小白的大模型学习路径

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理