桦雄

2024-05-15

走进RDS之MySQL内存分配与管理（中）

MySQL内存分配与管理总体上分为上中下三篇介绍，本篇为中篇，主要介绍 InnoDB 的内存构成和使用，代码版本主要基于8.0.25。

桦雄

61,448

CloudImagine

2024-05-15

123

AIGC下一步：用AI再度重构或优化媒体处理

LiveVideoStackCon2023深圳站，阿里云视频云演讲分享

CloudImagine

123

王骜

2024-05-15

164939

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

本文介绍如何使用函数计算 GPU 实例闲置模式低成本、快速的部署 Google Gemma 模型服务。

王骜

164,939

阿里云存储

2024-05-15

978

AIGC训练场景下的存储特征研究

在今天这样以AIGC为代表的AI时代下，了解训练场景对于存储的具体诉求同样是至关重要的。本文将尝试解读WEKA的一个相关报告，来看看AIGC对于存储有哪些具体的性能要求。

阿里云存储

978

阿里云云原生

2024-05-15

153446

Higress 基于自定义插件访问 Redis

本文介绍了Higress，一个支持基于WebAssembly (WASM) 的边缘计算网关，它允许用户使用Go、C++或Rust编写插件来扩展其功能。文章特别讨论了如何利用Redis插件实现限流、缓存和会话管理等高级功能。

阿里云云原生

153,446

ModelScope

2024-05-15

428

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

本期文章，我们会介绍一下AgentScope的一个设计哲学（Agent-oriented programming）

ModelScope

428

ModelScope

2024-05-15

411

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

411

阿里云实时数仓Hologres

2024-05-15

74405

大数据分析平台之 OLAP 架构的最佳实践

本文将分享聚水潭云原生 OLAP 架构的最佳实践。

阿里云实时数仓Hologres

74,405

阿里云云原生

2024-05-15

61149

云效 Pipeline as Code 来了，这些场景，用好它效率翻倍

可视化与YAML编排兼具，云效CI/CD流水线你愿意打几分？

阿里云云原生

61,149

类目筛选

内容类型

走进RDS之MySQL内存分配与管理（中）

AIGC下一步：用AI再度重构或优化媒体处理

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

AIGC训练场景下的存储特征研究

Higress 基于自定义插件访问 Redis

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

vLLM部署Yuan2.0：高吞吐、更便捷

大数据分析平台之 OLAP 架构的最佳实践

云效 Pipeline as Code 来了，这些场景，用好它效率翻倍