官方博客-第13页-阿里云开发者社区

阿里云云原生

2025-05-06

1328

MCP 规范新版本特性全景解析与落地实践

MCP Specification 在 2025-03-26 发布了最新的版本，本文对主要的改动进行详细介绍和解释

阿里云云原生

1,328

ModelScope

2024-05-15

1167

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,167

君启

2024-11-29

1161

性能提升利器｜PolarDB- X 超详细列存查询技术解读

本文将深入探讨 PolarDB-X 列存查询引擎的分层缓存解决方案，以及其在优化 ORC 列存查询性能中的关键作用。

君启

1,161

恶来

2023-05-15

7485

消息队列之 MetaQ 和 Kafka 区别和优势详解

本篇文章介绍MetaQ和Kafka这两个消息队列的区别和优势。

恶来

7,485

子白

2024-05-15

102467

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,467

ModelScope

2024-05-15

1224

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,224

阿里云云原生

2024-05-16

57082

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

本文介绍了 Kubernetes 中的容器工作内存（WorkingSet）概念，它用于表示容器内存的实时使用量，尤其是活跃内存。

阿里云云原生

57,082

阿里云存储

2024-10-15

1298

AI时代数据湖实践

本文分享了如何利用阿里云的存储解决方案构建一个具备高效处理、高时效性的AI数据湖，通过高吞吐训练和高效推理帮助企业快速实现数据价值，以及用户在使用中的最佳实践。

阿里云存储

1,298

青熙

2024-11-15

1245

AI经营｜多Agent择优生成商品标题

商品标题中关键词的好坏是商品能否被主搜检索到的关键因素，使用大模型自动优化标题成为【AI经营】中的核心能力之一，本文讲述大模型如何帮助商家优化商品素材，提升商品竞争力。

青熙

1,245

官方博客-第13页-阿里云开发者社区

类目筛选

内容类型

MCP 规范新版本特性全景解析与落地实践

vLLM部署Yuan2.0：高吞吐、更便捷

性能提升利器｜PolarDB- X 超详细列存查询技术解读

消息队列之 MetaQ 和 Kafka 区别和优势详解

大语言模型推理提速，TensorRT-LLM 高性能推理实践

元象大模型开源30款量化版本加速低成本部署丨附教程

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

AI时代数据湖实践

AI经营｜多Agent择优生成商品标题

官方博客-第13页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

MCP 规范新版本特性全景解析与落地实践

vLLM部署Yuan2.0：高吞吐、更便捷

性能提升利器｜PolarDB- X 超详细列存查询技术解读

消息队列之 MetaQ 和 Kafka 区别和优势详解

大语言模型推理提速，TensorRT-LLM 高性能推理实践

元象大模型开源30款量化版本 加速低成本部署丨附教程

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

AI时代数据湖实践

AI经营｜多Agent择优生成商品标题

元象大模型开源30款量化版本加速低成本部署丨附教程