官方博客-第7页-阿里云开发者社区

白玙

2025-03-14

2056

详解大模型应用可观测全链路

阿里云可观测解决方案从几个方面来尝试帮助使用 QwQ、Deepseek 的 LLM 应用开发者来满足领域化的可观测述求。

白玙

2,056

唐殊

2024-11-01

2293

探索LLM推理全阶段的JSON格式输出限制方法

文章详细讨论了如何确保大型语言模型（LLMs）输出结构化的JSON格式，这对于提高数据处理的自动化程度和系统的互操作性至关重要。

唐殊

2,293

荣阳

2025-02-28

1380

使用A10单卡24G复现DeepSeek R1强化学习过程

本文描述DeepSeek的三个模型的学习过程，其中DeepSeek-R1-Zero模型所涉及的强化学习算法，是DeepSeek最核心的部分之一会重点展示。

荣阳

1,380

ModelScope

2024-05-15

15431

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

Meta发布了 Meta Llama 3系列，是LLama系列开源大型语言模型的下一代。在接下来的几个月，Meta预计将推出新功能、更长的上下文窗口、额外的模型大小和增强的性能，并会分享 Llama 3 研究论文。

ModelScope

15,431

阿里云云原生

2025-04-23

1178

十几行代码实现 Manus，Spring AI Alibaba Graph 快速预览

Spring AI Alibaba Graph 的核心开发已完成，即将发布正式版本。开发者可基于此轻松构建工作流、智能体及多智能体系统，功能丰富且灵活。文章通过三个示例展示了其应用：1) 客户评价处理系统，实现两级问题分类与自动处理；2) 基于 ReAct Agent 的天气预报查询系统，循环执行用户指令直至完成；3) 基于 Supervisor 多智能体的 OpenManus 实现，简化了流程控制逻辑并优化了工具覆盖度。此外，还提供了运行示例的方法及未来规划，欢迎开发者参与贡献。

阿里云云原生

1,178

米基

2024-05-15

4052

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

4,052

阿里云云原生

2024-09-25

1024

新场景、新能力，AI-native 时代的可观测革新

借助 AI-native 可观测解决方案，阿里云为用户提供开箱即用的覆盖大模型应用、大模型到基础设施的全链路实时观测、告警与诊断能力，帮助企业在复杂的数字化转型过程中更有效地确保资源的高效利用与业务的持续成功。

阿里云云原生

1,024

子潍

2025-05-22

1698

自媒体创作场景实践｜通义千问3 + MCP=一切皆有可能

本文介绍了通过MCP（Model Context Protocol）结合通义千问大模型实现跨平台、跨服务的自动化任务处理方案。使用Qwen3-235B-A22B模型，配合ComfyUI生成图像，并通过小红书等社交媒体发布内容，展示了如何打破AI云服务的数据孤岛。具体实践包括接入FileSystem、ComfyUI和第三方媒体Server，完成从本地文件读取到生成图像再到发布的全流程。方案优势在于高可扩展性和易用性，但也存在大模型智能化不足、MCP Server开发难度较大及安全风险等问题。未来需进一步提升模型能力、丰富应用场景并解决安全挑战，推动MCP在更多领域落地。

子潍

1,698

隆基

2024-05-15

143060

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

了解 RocketMQ 5.0 的核心概念和架构概览；然后我们会从集群角度出发，从宏观视角学习 RocketMQ 的管控链路、数据链路、客户端和服务端如何交互；学习 RocketMQ 如何实现数据的存储，数据的高可用，如何利用云原生存储进一步提升竞争力。

隆基

143,060

官方博客-第7页-阿里云开发者社区

类目筛选

内容类型

详解大模型应用可观测全链路

探索LLM推理全阶段的JSON格式输出限制方法

使用A10单卡24G复现DeepSeek R1强化学习过程

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

十几行代码实现 Manus，Spring AI Alibaba Graph 快速预览

大模型推理优化实践：KV cache复用与投机采样

新场景、新能力，AI-native 时代的可观测革新

自媒体创作场景实践｜通义千问3 + MCP=一切皆有可能

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

官方博客-第7页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

详解大模型应用可观测全链路

探索LLM推理全阶段的JSON格式输出限制方法

使用A10单卡24G复现DeepSeek R1强化学习过程

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

十几行代码实现 Manus，Spring AI Alibaba Graph 快速预览

大模型推理优化实践：KV cache复用与投机采样

新场景、新能力，AI-native 时代的可观测革新

自媒体创作场景实践｜通义千问3 + MCP=一切皆有可能

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？