官方博客-第12页-阿里云开发者社区

阿里云云原生

2025-05-15

898

MCP Server On FC之旅2: 从0到1-MCP Server市场构建与存量OpenAPI转MCP Server

本文介绍了将社区主流STDIO MCP Server一键转为企业内可插拔Remote MCP Server的方法，以及存量API智能化重生的解决方案。通过FunctionAI平台模板实现STDIO MCP Server到SSE MCP Server的快速部署，并可通过“npx”或“uvx”命令调试。同时，文章还探讨了如何将OpenAPI规范数据转化为MCP Server实例，支持API Key、HTTP Basic和OAuth 2.0三种鉴权配置。该方案联合阿里云百练、魔搭社区等平台，提供低成本、高效率的企业级MCP Server服务化路径，助力AI应用生态繁荣。

阿里云云原生

898

恶来

2023-05-15

7477

消息队列之 MetaQ 和 Kafka 区别和优势详解

本篇文章介绍MetaQ和Kafka这两个消息队列的区别和优势。

恶来

7,477

阿里云云原生

2024-09-25

790

新场景、新能力，AI-native 时代的可观测革新

借助 AI-native 可观测解决方案，阿里云为用户提供开箱即用的覆盖大模型应用、大模型到基础设施的全链路实时观测、告警与诊断能力，帮助企业在复杂的数字化转型过程中更有效地确保资源的高效利用与业务的持续成功。

阿里云云原生

790

子白

2024-05-15

102460

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,460

ModelScope

2024-05-15

1163

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,163

阿里云云原生

2024-05-16

57073

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

本文介绍了 Kubernetes 中的容器工作内存（WorkingSet）概念，它用于表示容器内存的实时使用量，尤其是活跃内存。

阿里云云原生

57,073

龙蜥社区OpenAnolis

2024-11-06

2929

AI 场景下确保模型数据安全，Confidential AI 技术最佳实践解读

机密计算软硬结合技术保障数据安全。

龙蜥社区OpenAnolis

2,929

赫曦

2024-05-15

93200

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

本文主要介绍了通过弹性，实现成本优化，解决集群资源利用率难题。

赫曦

93,200

ModelScope

2024-05-15

1869

Multi-Agent实践第7期：智能体的高效协作

教程第7期

ModelScope

1,869

官方博客-第12页-阿里云开发者社区

类目筛选

内容类型

MCP Server On FC之旅2: 从0到1-MCP Server市场构建与存量OpenAPI转MCP Server

消息队列之 MetaQ 和 Kafka 区别和优势详解

新场景、新能力，AI-native 时代的可观测革新

大语言模型推理提速，TensorRT-LLM 高性能推理实践

vLLM部署Yuan2.0：高吞吐、更便捷

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

AI 场景下确保模型数据安全，Confidential AI 技术最佳实践解读

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

Multi-Agent实践第7期：智能体的高效协作

官方博客-第12页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

MCP Server On FC之旅2: 从0到1-MCP Server市场构建与存量OpenAPI转MCP Server

消息队列之 MetaQ 和 Kafka 区别和优势详解

新场景、新能力，AI-native 时代的可观测革新

大语言模型推理提速，TensorRT-LLM 高性能推理实践

vLLM部署Yuan2.0：高吞吐、更便捷

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

AI 场景下确保模型数据安全，Confidential AI 技术最佳实践解读

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

Multi-Agent实践第7期：智能体的高效协作