子白

2024-05-15

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,262

升雨

2024-08-16

7872

PolarDB-X的TPC-H列存执行计划

本文从官方的角度逐条解析PolarDB-X在TPC-H列存执行计划的设计要点。这些要点不仅包含了各项优化的原理，还提供了相关的证明与代码实现，希望帮助读者更深入地理解PolarDB-X的列存优化器。

升雨

7,872

执少

2024-09-06

58

高基数 GroupBy 在 SLS SQL 中的查询加速

本文详细介绍了SLS中的高基数GroupBy查询加速技术。

执少

58

谷乂

2024-08-16

19712

Apache RocketMQ 批处理模型演进之路

RocketMQ 早期批处理模型存在一定的约束条件，为进一步提升性能，RocketMQ 进行了索引构建流水线改造，同时 BatchCQ 模型和 AutoBatch 模型也优化了批处理流程，提供了更简便的使用体验，快点击本文查看详情及配置展示~

谷乂

19,712

阿里云网络

2024-05-15

128181

重磅解读阿里云云网络领域关键技术创新

2023年10月31日，杭州·云栖大会，阿里云技术主论坛带来了一场关于阿里云主力产品与技术创新的深度解读，阿里云网络产品线负责人祝顺民带来《云智创新，网络随行》的主题发言，针对阿里云飞天洛神云网络（下文简称洛神网络）领域产品服务创新以及背后的技术积累进行了深度解读，不少背后的创新技术系首次重磅披露。

阿里云网络

128,181

斜阳

2024-05-15

132547

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

斜阳

132,547

阿里云存储

2024-05-15

94935

AIGC训练场景下的存储特征研究

在今天这样以AIGC为代表的AI时代下，了解训练场景对于存储的具体诉求同样是至关重要的。本文将尝试解读WEKA的一个相关报告，来看看AIGC对于存储有哪些具体的性能要求。

阿里云存储

94,935

阿里云实时数仓Hologres

2024-06-07

128862

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01

阿里云实时数仓Hologres

128,862

问思望宸

2024-08-12

7718

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

本文分享了作为一款全能型网关【云原生 API 网关】是如何帮助企业落地统一网关架构的。

问思望宸

7,718

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

PolarDB-X的TPC-H列存执行计划

高基数 GroupBy 在 SLS SQL 中的查询加速

Apache RocketMQ 批处理模型演进之路

重磅解读阿里云云网络领域关键技术创新

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

AIGC训练场景下的存储特征研究

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关