官方博客-第9页-阿里云开发者社区

ModelScope

2024-05-15

3610

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

通义千问团队推出Qwen系列的首个MoE模型，Qwen1.5-MoE-A2.7B。

ModelScope

3,610

阿里云云原生

2024-05-15

73833

通义灵码技术解析，打造 AI 原生开发新范式

本文第一部分先介绍 AIGC 对软件研发的根本性影响，从宏观上介绍当下的趋势；第二部分将介绍 Copilot 模式，第三部分是未来软件研发 Agent 产品的进展。

阿里云云原生

73,833

乐忱

2024-06-14

39965

阿里云存储产品高级解决方案架构师欧阳雁（乐忱）分享了中国企业在全闪存高端存储市场的快速增长，指出AI大模型的发展推动了企业级存储市场。去年，高端企业级存储闪存占比约为25%，相较于欧美50%的比例，显示出中国在AI领域的巨大增长潜力。演讲涵盖AI业务流程，包括数据预处理、训练和推理的痛点，以及针对这些环节的存储解决方案，强调了稳定、高性能和生命周期管理的重要性。此外，还介绍了数据预处理的全球加速和弹性临时盘技术，训练阶段的高性能存储架构，推理场景的加速器和AI Agent的应用，以及应对大数据业务的存储考量，如对象存储、闪电立方和冷归档存储产品。

乐忱

39,965

望宸

2025-02-07

868

浏览量超 10w 的热图，描述 RAG 的主流架构

大模型性能的持续提升，进一步挖掘了 RAG 的潜力，RAG 将检索系统与生成模型相结合，带来诸多优势，如实时更新知识、降低成本等。点击本文，为您梳理 RAG 的基本信息，并介绍提升大模型生成结果的方法，快一起看看吧~

望宸

868

阿里云云原生

2025-08-05

1107

如何实现 AI Agent 自主发现和使用 MCP 服务 —— Nacos MCP Router 部署最佳实践

Nacos社区推出MCP Router与MCP Registry开源解决方案，助力AI Agent高效调用外部工具。Router可智能筛选匹配的MCP Server，减少Token消耗，提升安全性与部署效率。结合Nacos Registry实现服务自动发现与管理，简化AI Agent集成复杂度。支持协议转换与容器化部署，保障服务隔离与数据安全。提供智能路由与代理模式，优化工具调用性能，助力MCP生态普及。

阿里云云原生

1,107

子白

2024-05-15

102501

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,501

隆基

2024-05-15

142880

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

了解 RocketMQ 5.0 的核心概念和架构概览；然后我们会从集群角度出发，从宏观视角学习 RocketMQ 的管控链路、数据链路、客户端和服务端如何交互；学习 RocketMQ 如何实现数据的存储，数据的高可用，如何利用云原生存储进一步提升竞争力。

隆基

142,880

阿里云云原生

2024-07-01

33183

详解微服务应用灰度发布最佳实践

相对于传统软件研发，微服务架构下典型的需求交付最大的区别在于有了能够小范围真实验证的机制，且交付单位较小，风险可控，灰度发布可以弥补线下测试的不足。本文从 DevOps 视角概述灰度发布实践，介绍如何将灰度发布与 DevOps 工作融合，快来了解吧~

阿里云云原生

33,183

砚染

2024-09-03

1625

速成RAG+Agent框架大模型应用搭建

本文侧重于能力总结和实操搭建部分，从大模型应用的多个原子能力实现出发，到最终串联搭建一个RAG+Agent架构的大模型应用。

砚染

1,625

官方博客-第9页-阿里云开发者社区

类目筛选

内容类型

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

通义灵码技术解析，打造 AI 原生开发新范式

AI时代：云存储加速多模态数据存储与管理创新

浏览量超 10w 的热图，描述 RAG 的主流架构

如何实现 AI Agent 自主发现和使用 MCP 服务 —— Nacos MCP Router 部署最佳实践

大语言模型推理提速，TensorRT-LLM 高性能推理实践

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

详解微服务应用灰度发布最佳实践

速成RAG+Agent框架大模型应用搭建

官方博客-第9页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

通义灵码技术解析，打造 AI 原生开发新范式

AI时代：云存储加速多模态数据存储与管理创新

浏览量超 10w 的热图，描述 RAG 的主流架构

如何实现 AI Agent 自主发现和使用 MCP 服务 —— Nacos MCP Router 部署最佳实践

大语言模型推理提速，TensorRT-LLM 高性能推理实践

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

详解微服务应用灰度发布最佳实践

速成RAG+Agent框架大模型应用搭建