官方博客-第14页-阿里云开发者社区

望宸

2025-02-28

1286

大模型推理主战场：通信协议的标配

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,286

阿里云云原生

2025-04-07

812

极氪汽车云原生架构落地实践

随着极氪数字业务的飞速发展，背后的 IT 技术也在不断更新迭代。极氪极为重视客户对服务的体验，并将系统稳定性、业务功能的迭代效率、问题的快速定位和解决视为构建核心竞争力的基石。

阿里云云原生

812

张佐玮

2023-12-01

1659

Koordinator 助力云原生应用性能提升，小红书混部技术实践

本文基于 2023 云栖大会上关于 Koordinator 分享的实录，介绍小红书通过规模化落地混部技术来大幅提升集群资源效能，降低业务资源成本。

张佐玮

1,659

ModelScope

2024-05-15

1992

Multi-Agent实践第7期：智能体的高效协作

教程第7期

ModelScope

1,992

阿里云云原生

2024-12-04

783

不写一行代码，通义灵码 5 分钟“手撕”年会抽奖程序

年会中的抽奖环节不可或缺，但每年为了选择合适的抽奖小程序，团队往往需要投入大量时间和精力。然而，抽奖结束后，参与者通常只记得自己是否中奖，其他细节多被遗忘。在 AI 技术日益成熟的今天，如何打造一个既高效又有技术含量的抽奖应用呢？今天，就让我们跟随通义灵码，仅用 5 分钟现场手撕一个抽奖应用吧！

阿里云云原生

783

雨鸦

2024-12-27

1736

极简开发，极速上线：构建端到端大模型应用

本文将以一个经典的 RAG（检索增强生成）知识问答系统为例，详细介绍从智能体设计到最终应用部署的全流程。

雨鸦

1,736

正己

2025-01-06

427

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

Kubernetes 体系基于 DNS 的服务发现为开发者提供了很大的便利，但其高度复杂的架构往往带来更高的稳定性风险。以 Nacos 为代表的独立服务发现系统架构简单，在 Kubernetes 中选择独立服务发现系统可以帮助增强业务可靠性、可伸缩性、性能及可维护性，对于规模大、增长快、稳定性要求高的业务来说是一个较理想的服务发现方案。希望大家都能找到适合自己业务的服务发现系统。

正己

427

阿里云云原生

2025-05-12

1173

如何在通义灵码里使用 MCP 能力

通义灵码支持MCP工具使用，通过模型自主规划实现工具调用，深度集成魔搭MCP广场，涵盖2400+热门服务。提供STDIO和SSE两种通信模式，适用于不同场景需求。用户可通过智能体模式调用MCP工具，完成如网页内容抓取、天气查询等任务。文档详细介绍了服务配置、使用流程及常见问题解决方法，助力开发者高效拓展AI编码能力。

阿里云云原生

1,173

壬云

2025-05-29

1541

MCP进阶：一键批量搞定MCP工具部署

本文介绍了一种基于阿里云计算巢的一站式MCP工具解决方案，解决了传统MCP工具集成中的效率低下、调用方式割裂和动态管理困难等问题。方案通过标准化协议实现多MCP工具批量部署，提高云资源利用率，并支持OpenAPI与MCP双通道调用，使主流AI助手如Dify、Cherry Studio等无缝接入。内容涵盖背景、原理剖析、部署使用实战及问题排查，最后强调MCP协议作为“通用语言”连接数字与物理世界的重要性。

壬云

1,541

官方博客-第14页-阿里云开发者社区

类目筛选

内容类型

大模型推理主战场：通信协议的标配

极氪汽车云原生架构落地实践

Koordinator 助力云原生应用性能提升，小红书混部技术实践

Multi-Agent实践第7期：智能体的高效协作

不写一行代码，通义灵码 5 分钟“手撕”年会抽奖程序

极简开发，极速上线：构建端到端大模型应用

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

如何在通义灵码里使用 MCP 能力

MCP进阶：一键批量搞定MCP工具部署

官方博客-第14页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理主战场：通信协议的标配

极氪汽车云原生架构落地实践

Koordinator 助力云原生应用性能提升，小红书混部技术实践

Multi-Agent实践第7期：智能体的高效协作

不写一行代码，通义灵码 5 分钟“手撕”年会抽奖程序

极简开发，极速上线：构建端到端大模型应用

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

如何在通义灵码里使用 MCP 能力

MCP进阶：一键批量搞定MCP工具部署