执少

2024-09-06

高基数 GroupBy 在 SLS SQL 中的查询加速

本文详细介绍了SLS中的高基数GroupBy查询加速技术。

执少

58

谷乂

2024-08-16

19712

Apache RocketMQ 批处理模型演进之路

RocketMQ 早期批处理模型存在一定的约束条件，为进一步提升性能，RocketMQ 进行了索引构建流水线改造，同时 BatchCQ 模型和 AutoBatch 模型也优化了批处理流程，提供了更简便的使用体验，快点击本文查看详情及配置展示~

谷乂

19,712

子白

2024-05-15

101258

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,258

ModelScope

2024-05-15

108950

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

108,950

ModelScope

2024-05-15

2153

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

通义千问团队推出Qwen系列的首个MoE模型，Qwen1.5-MoE-A2.7B。

ModelScope

2,153

升雨

2024-08-16

7869

PolarDB-X的TPC-H列存执行计划

本文从官方的角度逐条解析PolarDB-X在TPC-H列存执行计划的设计要点。这些要点不仅包含了各项优化的原理，还提供了相关的证明与代码实现，希望帮助读者更深入地理解PolarDB-X的列存优化器。

升雨

7,869

岱泽

2024-05-15

75567

总结｜性能优化思路及常用工具及手段

性能优化是降低成本的手段之一，每年大促前业务平台都会组织核心链路上的应用做性能优化，一方面提升系统性能，另外一方面对腐化的代码进行清理。本文结合业务平台性能优化的经验，探讨一下性能优化的思路及常用工具及手段。

岱泽

75,567

ModelScope

2024-05-15

824

Multi-Agent实践第7期：智能体的高效协作

教程第7期

ModelScope

824

悟鸣

2024-05-15

238583

一文掌握大模型提示词技巧：从战略到战术

本文将用通俗易懂的语言，带你从战略（宏观）和战术（微观）两个层次掌握大模型提示词的常见技巧，真正做到理论和实践相结合，占领 AI 运用的先机。

悟鸣

238,583

类目筛选

内容类型

高基数 GroupBy 在 SLS SQL 中的查询加速

Apache RocketMQ 批处理模型演进之路

大语言模型推理提速，TensorRT-LLM 高性能推理实践

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

PolarDB-X的TPC-H列存执行计划

总结｜性能优化思路及常用工具及手段

Multi-Agent实践第7期：智能体的高效协作

一文掌握大模型提示词技巧：从战略到战术