官方博客-第11页-阿里云开发者社区

施晨尹丰彬筱文李林杨黄俊等

2023-11-07

43750

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

基于原始的阿里云计算平台产技文档，搭建一套基于大模型检索增强答疑机器人。本方案已在阿里云线上多个场景落地，将覆盖阿里云官方答疑群聊、研发答疑机器人、钉钉技术服务助手等。线上工单拦截率提升10+%，答疑采纳率70+%，显著提升答疑效率。

施晨尹丰彬筱文李林杨黄俊等

43,750

子白

2024-05-15

102472

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,472

阿里云云原生

2024-05-15

63367

All in One：Prometheus 多实例数据统一管理最佳实践

当管理多个Prometheus实例时，阿里云Prometheus托管版相比社区版提供了更可靠的数据采集和便捷的管理。本文比较了全局聚合实例与数据投递方案，两者在不同场景下各有优劣。

阿里云云原生

63,367

坤硕

2024-07-29

20120

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

基于大语言模型的应用在性能、成本、效果等方面存在一系列实际痛点，本文通过分析 LLM 应用模式以及关注点差异来阐明可观测技术挑战，近期阿里云可观测推出了面向 LLM 应用的可观测解决方案以及最佳实践，一起来了解下吧。

坤硕

20,120

阿里云云原生

2025-04-17

1264

通义灵码 Rules 库合集来了，覆盖Java、TypeScript、Python、Go、JavaScript 等

通义灵码新上的外挂 Project Rules 获得了开发者的一致好评：最小成本适配我的开发风格、相当把团队经验沉淀下来，是个很好功能……

阿里云云原生

1,264

裘展

2024-11-07

1689

白话文讲解大模型｜ Attention is all you need

本文档旨在详细阐述当前主流的大模型技术架构如Transformer架构。我们将从技术概述、架构介绍到具体模型实现等多个角度进行讲解。通过本文档，我们期望为读者提供一个全面的理解，帮助大家掌握大模型的工作原理，增强与客户沟通的技术基础。本文档适合对大模型感兴趣的人员阅读。

裘展

1,689

阿里云云原生

2025-06-03

1100

实现企业级 MCP 服务统一管理和智能检索的实践

本文将深入剖析 MCP Server 的五种主流架构模式，并结合 Nacos 服务治理框架，为企业级 MCP 部署提供实用指南。

阿里云云原生

1,100

恶来

2023-05-15

7489

消息队列之 MetaQ 和 Kafka 区别和优势详解

本篇文章介绍MetaQ和Kafka这两个消息队列的区别和优势。

恶来

7,489

ModelScope

2024-05-15

1226

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,226

官方博客-第11页-阿里云开发者社区

类目筛选

内容类型

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

大语言模型推理提速，TensorRT-LLM 高性能推理实践

All in One：Prometheus 多实例数据统一管理最佳实践

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

通义灵码 Rules 库合集来了，覆盖Java、TypeScript、Python、Go、JavaScript 等

白话文讲解大模型｜ Attention is all you need

实现企业级 MCP 服务统一管理和智能检索的实践

消息队列之 MetaQ 和 Kafka 区别和优势详解

元象大模型开源30款量化版本加速低成本部署丨附教程

官方博客-第11页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

大语言模型推理提速，TensorRT-LLM 高性能推理实践

All in One：Prometheus 多实例数据统一管理最佳实践

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

通义灵码 Rules 库合集来了，覆盖Java、TypeScript、Python、Go、JavaScript 等

白话文讲解大模型｜ Attention is all you need

实现企业级 MCP 服务统一管理和智能检索的实践

消息队列之 MetaQ 和 Kafka 区别和优势详解

元象大模型开源30款量化版本 加速低成本部署丨附教程

元象大模型开源30款量化版本加速低成本部署丨附教程