官方博客-第6页-阿里云开发者社区

赵世振

2024-08-22

1523

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

在阿里云平台上，您只需十分钟，无需任何编码，即可在企业微信上为您的组织集成一个具备大模型能力的AI助手。此助手可24小时响应用户咨询，解答各类问题，尤其擅长处理私域问题，从而成为您企业的专属助手，有效提升用户体验及业务竞争力。

赵世振

1,523

白玙

2025-03-14

2051

详解大模型应用可观测全链路

阿里云可观测解决方案从几个方面来尝试帮助使用 QwQ、Deepseek 的 LLM 应用开发者来满足领域化的可观测述求。

白玙

2,051

阿里云云原生

2025-04-23

1175

十几行代码实现 Manus，Spring AI Alibaba Graph 快速预览

Spring AI Alibaba Graph 的核心开发已完成，即将发布正式版本。开发者可基于此轻松构建工作流、智能体及多智能体系统，功能丰富且灵活。文章通过三个示例展示了其应用：1) 客户评价处理系统，实现两级问题分类与自动处理；2) 基于 ReAct Agent 的天气预报查询系统，循环执行用户指令直至完成；3) 基于 Supervisor 多智能体的 OpenManus 实现，简化了流程控制逻辑并优化了工具覆盖度。此外，还提供了运行示例的方法及未来规划，欢迎开发者参与贡献。

阿里云云原生

1,175

翎薇

2025-05-22

2401

多快好省，Qwen3混合部署模式引爆MCP

本文介绍了MCP（Model Context Protocol）与Qwen3模型的结合应用。MCP通过统一协议让AI模型连接各种工具和数据源，类似AI世界的“USB-C”接口。文中详细解析了MCP架构，包括Host、Client和Server三个核心组件，并说明了模型如何智能选择工具及工具执行反馈机制。Qwen3作为新一代通义千问模型，采用混合专家架构，具备235B参数但仅需激活22B，支持快速与深度思考模式，多语言处理能力覆盖119种语言。文章还展示了Qwen3的本地部署流程，以及开发和调试MCP Server与Client的具体步骤。

翎薇

2,401

米基

2024-05-15

4049

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

4,049

望雲十雨言澈

2025-04-10

752

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

752

ModelScope

2025-05-23

1795

通义灵码 + 魔搭MCP：全流程构建创空间应用

最近，通义灵码上线 MCP（ModelScope Cloud Platform）功能，从之前代码生成及修改的基础功能，到可以使用MCP服务连接更多功能，开发者可以实现从代码爬取、模型推理到应用部署

ModelScope

1,795

隆基

2024-05-15

143057

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

了解 RocketMQ 5.0 的核心概念和架构概览；然后我们会从集群角度出发，从宏观视角学习 RocketMQ 的管控链路、数据链路、客户端和服务端如何交互；学习 RocketMQ 如何实现数据的存储，数据的高可用，如何利用云原生存储进一步提升竞争力。

隆基

143,057

望宸

2025-02-07

1131

浏览量超 10w 的热图，描述 RAG 的主流架构

大模型性能的持续提升，进一步挖掘了 RAG 的潜力，RAG 将检索系统与生成模型相结合，带来诸多优势，如实时更新知识、降低成本等。点击本文，为您梳理 RAG 的基本信息，并介绍提升大模型生成结果的方法，快一起看看吧~

望宸

1,131

官方博客-第6页-阿里云开发者社区

类目筛选

内容类型

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

详解大模型应用可观测全链路

十几行代码实现 Manus，Spring AI Alibaba Graph 快速预览

多快好省，Qwen3混合部署模式引爆MCP

大模型推理优化实践：KV cache复用与投机采样

AI Infra之模型显存管理分析

通义灵码 + 魔搭MCP：全流程构建创空间应用

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

浏览量超 10w 的热图，描述 RAG 的主流架构

官方博客-第6页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

详解大模型应用可观测全链路

十几行代码实现 Manus，Spring AI Alibaba Graph 快速预览

多快好省，Qwen3混合部署模式引爆MCP

大模型推理优化实践：KV cache复用与投机采样

AI Infra之模型显存管理分析

通义灵码 + 魔搭MCP：全流程构建创空间应用

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

浏览量超 10w 的热图，描述 RAG 的主流架构