子白

2024-05-15

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,262

升雨

2024-08-16

7872

PolarDB-X的TPC-H列存执行计划

本文从官方的角度逐条解析PolarDB-X在TPC-H列存执行计划的设计要点。这些要点不仅包含了各项优化的原理，还提供了相关的证明与代码实现，希望帮助读者更深入地理解PolarDB-X的列存优化器。

升雨

7,872

茏城

2024-06-28

194

深度｜大模型时代下，基于湖仓一体的数据智能新范式

本次文根据峰会演讲内容整理：分享在大模型时代基于湖仓一体的数据产品演进，以及我们观察到的一些智能开发相关的新范式。

茏城

194

执少

2024-09-06

58

高基数 GroupBy 在 SLS SQL 中的查询加速

本文详细介绍了SLS中的高基数GroupBy查询加速技术。

执少

58

谷乂

2024-08-16

19712

Apache RocketMQ 批处理模型演进之路

RocketMQ 早期批处理模型存在一定的约束条件，为进一步提升性能，RocketMQ 进行了索引构建流水线改造，同时 BatchCQ 模型和 AutoBatch 模型也优化了批处理流程，提供了更简便的使用体验，快点击本文查看详情及配置展示~

谷乂

19,712

霖玉

2023-06-15

13356

大数据SQL数据倾斜与数据膨胀的优化与经验总结

目前市面上大数据查询分析引擎层出不穷，但在业务使用过程中，大多含有性能瓶颈的SQL，主要集中在数据倾斜与数据膨胀问题中。本文结合业界对大数据SQL的使用与优化，尝试给出相对系统性的解决方案。

霖玉

13,356

斜阳

2024-05-15

132547

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

斜阳

132,547

阿里云存储

2024-05-15

94935

AIGC训练场景下的存储特征研究

在今天这样以AIGC为代表的AI时代下，了解训练场景对于存储的具体诉求同样是至关重要的。本文将尝试解读WEKA的一个相关报告，来看看AIGC对于存储有哪些具体的性能要求。

阿里云存储

94,935

阿里云实时数仓Hologres

2024-06-07

128862

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01

阿里云实时数仓Hologres

128,862

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

PolarDB-X的TPC-H列存执行计划

深度｜大模型时代下，基于湖仓一体的数据智能新范式

高基数 GroupBy 在 SLS SQL 中的查询加速

Apache RocketMQ 批处理模型演进之路

大数据SQL数据倾斜与数据膨胀的优化与经验总结

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

AIGC训练场景下的存储特征研究

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01