子白

2024-05-15

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,258

茏城

2024-06-28

192

深度｜大模型时代下，基于湖仓一体的数据智能新范式

本次文根据峰会演讲内容整理：分享在大模型时代基于湖仓一体的数据产品演进，以及我们观察到的一些智能开发相关的新范式。

茏城

192

升雨

2024-08-16

7869

PolarDB-X的TPC-H列存执行计划

本文从官方的角度逐条解析PolarDB-X在TPC-H列存执行计划的设计要点。这些要点不仅包含了各项优化的原理，还提供了相关的证明与代码实现，希望帮助读者更深入地理解PolarDB-X的列存优化器。

升雨

7,869

岱泽

2024-05-15

75567

总结｜性能优化思路及常用工具及手段

性能优化是降低成本的手段之一，每年大促前业务平台都会组织核心链路上的应用做性能优化，一方面提升系统性能，另外一方面对腐化的代码进行清理。本文结合业务平台性能优化的经验，探讨一下性能优化的思路及常用工具及手段。

岱泽

75,567

无哲

2024-05-15

47038

SLS 查询新范式：使用 SPL 对日志进行交互式探索

像 Unix 命令一样支持多级管道级联，像加工预览一样实时处理查询结果，更便捷的交互，更丰富的算子，更灵活的探索半结构化日志，快来试试使用 SPL 语言查询日志数据吧~

无哲

47,038

阿里云云原生

2024-05-15

66818

无需重新学习，使用 Kibana 查询/可视化 SLS 数据

本文演示了使用 Kibana 连接 SLS ES 兼容接口进行查询和分析的方法。

阿里云云原生

66,818

问思望宸

2024-08-12

7717

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

本文分享了作为一款全能型网关【云原生 API 网关】是如何帮助企业落地统一网关架构的。

问思望宸

7,717

隆基

2024-05-15

108496

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

本文主要学习 RocketMQ 的一致性特性，一致性对于交易、金融都是刚需。从大规模复杂业务出发，学习 RocketMQ 的 SQL 订阅、定时消息等特性。再从高可用的角度来看，这里更多的是大型公司对于高阶可用性的要求，如同城容灾、异地多活等。

隆基

108,496

佳二

2024-05-15

141

奇思妙想的SQL｜兼顾性能的数据倾斜处理新姿势

本篇为系列第2篇，分享在支付宝支付数据链路改造升级过程中，针对数据倾斜的优化实践新方法，在解决数据倾斜问题的同时，还能兼顾更优的计算性能！

佳二

141

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

深度｜大模型时代下，基于湖仓一体的数据智能新范式

PolarDB-X的TPC-H列存执行计划

总结｜性能优化思路及常用工具及手段

SLS 查询新范式：使用 SPL 对日志进行交互式探索

无需重新学习，使用 Kibana 查询/可视化 SLS 数据

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

奇思妙想的SQL｜兼顾性能的数据倾斜处理新姿势