官方博客-第10页-阿里云开发者社区

阿里云云原生

2025-05-15

908

MCP Server On FC之旅2: 从0到1-MCP Server市场构建与存量OpenAPI转MCP Server

本文介绍了将社区主流STDIO MCP Server一键转为企业内可插拔Remote MCP Server的方法，以及存量API智能化重生的解决方案。通过FunctionAI平台模板实现STDIO MCP Server到SSE MCP Server的快速部署，并可通过“npx”或“uvx”命令调试。同时，文章还探讨了如何将OpenAPI规范数据转化为MCP Server实例，支持API Key、HTTP Basic和OAuth 2.0三种鉴权配置。该方案联合阿里云百练、魔搭社区等平台，提供低成本、高效率的企业级MCP Server服务化路径，助力AI应用生态繁荣。

阿里云云原生

908

赵世振

2024-07-30

1970

阿里云百炼应用实践系列-AI助手快速搭建

本文主要介绍如何基于阿里云百炼平台快速在10分钟为您的网站添加一个 AI 助手。我们基于阿里云百炼平台的能力，以官方帮助文档为参考，搭建了一个以便全天候（7x24）回应客户咨询的AI助手，介绍了相关技术方案和主要代码，供开发者参考。

赵世振

1,970

赵世振

2024-12-24

1303

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

本篇文章详细讨论了如何确保大型语言模型（LLMs）输出结构化的JSON格式，这对于提高数据处理的自动化程度和系统的互操作性至关重要。

赵世振

1,303

阿里云云原生

2025-05-06

1328

MCP 规范新版本特性全景解析与落地实践

MCP Specification 在 2025-03-26 发布了最新的版本，本文对主要的改动进行详细介绍和解释

阿里云云原生

1,328

灵杰开发者

2025-08-08

644

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

简介：本文整理自阿里云高级技术专家李麟在Flink Forward Asia 2025新加坡站的分享，介绍了Flink 2.1 SQL在实时数据处理与AI融合方面的关键进展，包括AI函数集成、Join优化及未来发展方向，助力构建高效实时AI管道。

灵杰开发者

644

子白

2024-05-15

102467

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,467

ModelScope

2024-05-15

1224

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,224

ModelScope

2024-05-15

2606

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

本期文章，我们将向大家展示如何使用AgentScope中构建和使用具有RAG功能的智能体，创造AgentScope助手群，为大家解答和AgentScope相关的问题。

ModelScope

2,606

ModelScope

2024-05-15

1166

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,166

官方博客-第10页-阿里云开发者社区

类目筛选

内容类型

MCP Server On FC之旅2: 从0到1-MCP Server市场构建与存量OpenAPI转MCP Server

阿里云百炼应用实践系列-AI助手快速搭建

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

MCP 规范新版本特性全景解析与落地实践

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

大语言模型推理提速，TensorRT-LLM 高性能推理实践

元象大模型开源30款量化版本加速低成本部署丨附教程

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

vLLM部署Yuan2.0：高吞吐、更便捷

官方博客-第10页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

MCP Server On FC之旅2: 从0到1-MCP Server市场构建与存量OpenAPI转MCP Server

阿里云百炼应用实践系列-AI助手快速搭建

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

MCP 规范新版本特性全景解析与落地实践

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

大语言模型推理提速，TensorRT-LLM 高性能推理实践

元象大模型开源30款量化版本 加速低成本部署丨附教程

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

vLLM部署Yuan2.0：高吞吐、更便捷

元象大模型开源30款量化版本加速低成本部署丨附教程