王骜

2024-05-15

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

本文介绍如何使用函数计算 GPU 实例闲置模式低成本、快速的部署 Google Gemma 模型服务。

王骜

164,951

阿里云大数据Al技术

2024-05-15

77703

【AAAI 2024】MuLTI：高效视频与语言理解

多模态理解模型具有广泛的应用，比如多标签分类、视频问答（videoQA）和文本视频检索等。现有的方法已经在视频和语言理解方面取得了重大进展，然而，他们仍然面临两个巨大的挑战：无法充分的利用现有的特征；训练时巨大的GPU内存消耗。我们提出了MuLTI，这是一种高度准确高效的视频和语言理解模型，可以实现高效有效的特征融合和对下游任务的快速适应。本文详细介绍基于MuLTI实现高效视频与语言理解。

阿里云大数据Al技术

77,703

阿里云云原生

2024-05-15

153451

Higress 基于自定义插件访问 Redis

本文介绍了Higress，一个支持基于WebAssembly (WASM) 的边缘计算网关，它允许用户使用Go、C++或Rust编写插件来扩展其功能。文章特别讨论了如何利用Redis插件实现限流、缓存和会话管理等高级功能。

阿里云云原生

153,451

郑嘉扬何杉

2024-05-15

58800

享道出行：容器弹性技术驱动下的智慧出行稳定性实践

享道出行利用阿里云容器服务ACK，结合AHPA智能弹性与ECS、ECI混合部署，解决了业务潮汐效应带来的弹性滞后和成本问题。

郑嘉扬何杉

58,800

ModelScope

2024-05-15

156

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

近日，元象发布其首个Moe大模型 XVERSE-MoE-A4.2B，采用混合专家模型架构（Mixture of Experts），激活参数4.2B，效果即可媲美13B模型。该模型全开源，无条件免费商用，支持中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用，推动低成本部署。

ModelScope

156

阿里云云原生

2024-05-15

54859

Higress 全新 Wasm 运行时，性能大幅提升

本文介绍 Higress 将 Wasm 插件的运行时从 V8 切换到 WebAssembly Micro Runtime (WAMR) 的最新进展。

阿里云云原生

54,859

柳遵飞

2024-05-15

13090

Nacos 安全零信任实践

本文将介绍如何基于安全零信任的理念来保证 Nacos 的数据安全。

柳遵飞

13,090

阿里云云原生

2024-05-15

164943

OpenKruise v1.6 版本解读：增强多域管理能力

OpenKruise 在 2024.3 发布了最新的 v1.6 版本（ChangeLog），本文对新版本的核心特性做整体介绍。

阿里云云原生

164,943

阿里云云原生

2024-05-24

49873

AIOps 智能运维：比专家经验更优雅的错/慢调用分析工具

本文主要介绍ARMS 错/慢 Trace 分析功能基本原理；该功能能够覆盖哪些异常 Trace 根因；最后会介绍一些最佳实践案例。

阿里云云原生

49,873

类目筛选

内容类型

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

【AAAI 2024】MuLTI：高效视频与语言理解

Higress 基于自定义插件访问 Redis

享道出行：容器弹性技术驱动下的智慧出行稳定性实践

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

Higress 全新 Wasm 运行时，性能大幅提升

Nacos 安全零信任实践

OpenKruise v1.6 版本解读：增强多域管理能力

AIOps 智能运维：比专家经验更优雅的错/慢调用分析工具