官方博客-第8页-阿里云开发者社区

ModelScope

2024-05-15

15409

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

Meta发布了 Meta Llama 3系列，是LLama系列开源大型语言模型的下一代。在接下来的几个月，Meta预计将推出新功能、更长的上下文窗口、额外的模型大小和增强的性能，并会分享 Llama 3 研究论文。

ModelScope

15,409

右予故黎

2024-11-21

1234

“无”中生有：基于知识增强的RAG优化实践

本文作者基于自身在RAG技术领域长达半年的实践经验，分享了从初识RAG的潜力到面对实际应用挑战的心路历程，以及如何通过一系列优化措施逐步解决这些挑战的过程。

右予故黎

1,234

米基

2024-05-15

4042

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

4,042

阿里云云原生

2025-04-23

1163

十几行代码实现 Manus，Spring AI Alibaba Graph 快速预览

Spring AI Alibaba Graph 的核心开发已完成，即将发布正式版本。开发者可基于此轻松构建工作流、智能体及多智能体系统，功能丰富且灵活。文章通过三个示例展示了其应用：1) 客户评价处理系统，实现两级问题分类与自动处理；2) 基于 ReAct Agent 的天气预报查询系统，循环执行用户指令直至完成；3) 基于 Supervisor 多智能体的 OpenManus 实现，简化了流程控制逻辑并优化了工具覆盖度。此外，还提供了运行示例的方法及未来规划，欢迎开发者参与贡献。

阿里云云原生

1,163

赵世振

2024-12-24

1571

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

本篇文章详细讨论了如何确保大型语言模型（LLMs）输出结构化的JSON格式，这对于提高数据处理的自动化程度和系统的互操作性至关重要。

赵世振

1,571

隆基

2024-05-15

143049

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

了解 RocketMQ 5.0 的核心概念和架构概览；然后我们会从集群角度出发，从宏观视角学习 RocketMQ 的管控链路、数据链路、客户端和服务端如何交互；学习 RocketMQ 如何实现数据的存储，数据的高可用，如何利用云原生存储进一步提升竞争力。

隆基

143,049

刘军

2024-10-17

3299

阿里云开源 AI 应用开发框架：Spring AI Alibaba

阿里云开源 Spring AI Alibaba，旨在帮助 Java 开发者快速构建 AI 应用，共同构建物理新世界。

刘军

3,299

阿里云大数据Al技术

2025-07-28

1745

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

Qwen3-Coder 是通义千问最新开源的 AI 编程大模型正式开源，拥有卓越的代码和 Agent 能力，在多领域取得了开源模型的 SOTA 效果。PAI 已支持最强版本 Qwen3-Coder-480B-A35B-Instruct 的云上一键部署。

阿里云大数据Al技术

1,745

才胜南也

2024-09-05

1196

RAG效果优化：高质量文档解析详解

本文关于如何将非结构化数据（如PDF和Word文档）转换为结构化数据，以便于RAG（Retrieval-Augmented Generation）系统使用。

才胜南也

1,196

官方博客-第8页-阿里云开发者社区

类目筛选

内容类型

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

“无”中生有：基于知识增强的RAG优化实践

大模型推理优化实践：KV cache复用与投机采样

十几行代码实现 Manus，Spring AI Alibaba Graph 快速预览

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

阿里云开源 AI 应用开发框架：Spring AI Alibaba

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

RAG效果优化：高质量文档解析详解

官方博客-第8页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

“无”中生有：基于知识增强的RAG优化实践

大模型推理优化实践：KV cache复用与投机采样

十几行代码实现 Manus，Spring AI Alibaba Graph 快速预览

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

阿里云开源 AI 应用开发框架：Spring AI Alibaba

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

RAG效果优化：高质量文档解析详解