2024-05-15
101252

大语言模型推理提速,TensorRT-LLM 高性能推理实践

大型语言模型(Large language models,LLM)是基于大量数据进行预训练的超大型深度学习模型,本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

101,252
2024-07-22
14593

Spring Cloud Alibaba 集成分布式定时任务调度功能

Spring Cloud Alibaba 发布了 Scheduling 任务调度模块 [#3732]提供了一套开源、轻量级、高可用的定时任务解决方案,帮助您快速开发微服务体系下的分布式定时任务。

14,593
2024-08-16
19712

Apache RocketMQ 批处理模型演进之路

RocketMQ 早期批处理模型存在一定的约束条件,为进一步提升性能,RocketMQ 进行了索引构建流水线改造,同时 BatchCQ 模型和 AutoBatch 模型也优化了批处理流程,提供了更简便的使用体验,快点击本文查看详情及配置展示~

19,712
2024-08-19
19714

不改一行代码轻松玩转 Go 应用微服务治理

为了更好的进行 Go 应用微服务治理,提高研发效率和系统稳定性,本文将介绍 MSE 微服务治理方案,无需修改业务代码,实现治理能力。

19,714
2024-06-28
184

深度|大模型时代下,基于湖仓一体的数据智能新范式

本次文根据峰会演讲内容整理:分享在大模型时代基于湖仓一体的数据产品演进,以及我们观察到的一些智能开发相关的新范式。

184
2024-09-06
54

高基数 GroupBy 在 SLS SQL 中的查询加速

本文详细介绍了SLS中的高基数GroupBy查询加速技术。

54
2024-08-16
7861

PolarDB-X的TPC-H列存执行计划

本文从官方的角度逐条解析PolarDB-X在TPC-H列存执行计划的设计要点。这些要点不仅包含了各项优化的原理,还提供了相关的证明与代码实现,希望帮助读者更深入地理解PolarDB-X的列存优化器。

7,861

实时数仓Hologres OLAP场景核心能力介绍

Hologres提供统一、实时、弹性、易用的一站式实时数仓引擎,解决复杂OLAP难题。

2024-07-04
108397

全链路追踪 & 性能监控,GO 应用可观测全面升级

当前,大多数面向 Golang 应用的监控能力主要是通过 SDK 方式接入,需要开放人员手动进行埋点,会存在一定问题。对此,可观测 Go Agent 应运而生。本文介绍的阿里云可观测 Go Agent 方案,能通过无侵入的方式实现应用监控能力。

108,397
1
2
3
4
...
38
到第