官方博客-第13页-阿里云开发者社区

阿里云云原生

2025-01-26

1259

最近谈论 SSE 和 WebSocket 的人越来越多的原因

实时通信已经成了大模型应用的标配。

阿里云云原生

1,259

阿里云云原生

2025-05-15

892

MCP Server On FC之旅2: 从0到1-MCP Server市场构建与存量OpenAPI转MCP Server

本文介绍了将社区主流STDIO MCP Server一键转为企业内可插拔Remote MCP Server的方法，以及存量API智能化重生的解决方案。通过FunctionAI平台模板实现STDIO MCP Server到SSE MCP Server的快速部署，并可通过“npx”或“uvx”命令调试。同时，文章还探讨了如何将OpenAPI规范数据转化为MCP Server实例，支持API Key、HTTP Basic和OAuth 2.0三种鉴权配置。该方案联合阿里云百练、魔搭社区等平台，提供低成本、高效率的企业级MCP Server服务化路径，助力AI应用生态繁荣。

阿里云云原生

892

任庆盛

2023-02-22

23174

Flink CDC+Kafka 加速业务实时化

阿里巴巴开发工程师，Apache Flink Committer 任庆盛，在 9 月 24 日 Apache Flink Meetup 的分享。

任庆盛

23,174

阿里云云原生

2024-09-23

1123

重磅！阿里云可观测产品家族全新升级，AI +数据双驱动，打造全栈可观测体系

近日，阿里云可观测产品家族正式发布云监控 2.0，隶属产品日志服务 SLS、云监控 CMS、应用实时监控服务 ARMS 迎来重磅升级。

阿里云云原生

1,123

昱临

2024-11-14

1052

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结

笔者结合实践经验以近期在负责的复杂表格智能问答为切入点，结合大模型的哲学三问（“是谁、从哪里来、到哪里去”），穿插阐述自己对大模型的一些理解与判断，以及面向公共云LLM的建设模式思考，并分享软件设计+模型算法结合的一些研发实践经验。

昱临

1,052

望雲十雨言澈

2025-04-10

559

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

559

子白

2024-05-15

102452

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,452

ModelScope

2024-05-15

1156

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,156

澄潭钰诚

2024-07-19

21946

Higress 重磅更新：AI 能力全面开源，云原生能力再升级

Higress 最新的 1.4 版本基于为通义千问，以及多家云上 AGI 厂商客户提供 AI 网关的积累沉淀，开源了大量 AI 原生的网关能力。同时也在 Ingress、可观测、流控等云原生能力上做了全方位升级。

澄潭钰诚

21,946

官方博客-第13页-阿里云开发者社区

类目筛选

内容类型

最近谈论 SSE 和 WebSocket 的人越来越多的原因

MCP Server On FC之旅2: 从0到1-MCP Server市场构建与存量OpenAPI转MCP Server

Flink CDC+Kafka 加速业务实时化

重磅！阿里云可观测产品家族全新升级，AI +数据双驱动，打造全栈可观测体系

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结

AI Infra之模型显存管理分析

大语言模型推理提速，TensorRT-LLM 高性能推理实践

vLLM部署Yuan2.0：高吞吐、更便捷

Higress 重磅更新：AI 能力全面开源，云原生能力再升级

官方博客-第13页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

最近谈论 SSE 和 WebSocket 的人越来越多的原因

MCP Server On FC之旅2: 从0到1-MCP Server市场构建与存量OpenAPI转MCP Server

Flink CDC+Kafka 加速业务实时化

重磅！阿里云可观测产品家族全新升级，AI +数据双驱动，打造全栈可观测体系

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性 思考到实践经验总结

AI Infra之模型显存管理分析

大语言模型推理提速，TensorRT-LLM 高性能推理实践

vLLM部署Yuan2.0：高吞吐、更便捷

Higress 重磅更新：AI 能力全面开源，云原生能力再升级

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结