孟威

2024-05-15

SLS 大模型可观测&安全推理审计标准解决方案

本文介绍大模型可观测&安全推理审计解决方案和Demo演示，SLS 提供全面的 LLM 监控和日志记录功能。监控大模型使用情况和性能，自定义仪表盘；SLS 汇总 Actiontrail 事件、云产品可观测日志、LLM 网关明细日志、详细对话明细日志、Prompt Trace 和推理实时调用明细等数据，建设完整统一的大模型可观测方案，为用户的大模型安全推理审计提供全面合规支持。

孟威

104,301

赵世振

2024-08-21

237

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

通过使用“百炼”平台，您可以快速构建一个多代理（Multi-Agent）架构的智能导购助手。该助手能够通过多轮互动了解顾客的具体需求，收集详细信息后，利用“百炼”的知识检索增强功能或已有的商品数据库进行商品搜索，为顾客推荐最合适的产品。

赵世振

237

子白

2024-05-15

101261

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,261

ModelScope

2024-05-15

2156

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

通义千问团队推出Qwen系列的首个MoE模型，Qwen1.5-MoE-A2.7B。

ModelScope

2,156

升雨

2024-08-16

7872

PolarDB-X的TPC-H列存执行计划

本文从官方的角度逐条解析PolarDB-X在TPC-H列存执行计划的设计要点。这些要点不仅包含了各项优化的原理，还提供了相关的证明与代码实现，希望帮助读者更深入地理解PolarDB-X的列存优化器。

升雨

7,872

执少

2024-09-06

58

高基数 GroupBy 在 SLS SQL 中的查询加速

本文详细介绍了SLS中的高基数GroupBy查询加速技术。

执少

58

ModelScope

2024-05-15

108951

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

108,951

谷乂

2024-08-16

19712

Apache RocketMQ 批处理模型演进之路

RocketMQ 早期批处理模型存在一定的约束条件，为进一步提升性能，RocketMQ 进行了索引构建流水线改造，同时 BatchCQ 模型和 AutoBatch 模型也优化了批处理流程，提供了更简便的使用体验，快点击本文查看详情及配置展示~

谷乂

19,712

施晨尹丰彬筱文李林杨黄俊等

2023-11-07

42168

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

基于原始的阿里云计算平台产技文档，搭建一套基于大模型检索增强答疑机器人。本方案已在阿里云线上多个场景落地，将覆盖阿里云官方答疑群聊、研发答疑机器人、钉钉技术服务助手等。线上工单拦截率提升10+%，答疑采纳率70+%，显著提升答疑效率。

施晨尹丰彬筱文李林杨黄俊等

42,168

类目筛选

内容类型

SLS 大模型可观测&安全推理审计标准解决方案

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

PolarDB-X的TPC-H列存执行计划

高基数 GroupBy 在 SLS SQL 中的查询加速

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Apache RocketMQ 批处理模型演进之路

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统