子白

2024-05-15

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,264

升雨

2024-08-16

7872

PolarDB-X的TPC-H列存执行计划

本文从官方的角度逐条解析PolarDB-X在TPC-H列存执行计划的设计要点。这些要点不仅包含了各项优化的原理，还提供了相关的证明与代码实现，希望帮助读者更深入地理解PolarDB-X的列存优化器。

升雨

7,872

岱泽

2024-05-15

75570

总结｜性能优化思路及常用工具及手段

性能优化是降低成本的手段之一，每年大促前业务平台都会组织核心链路上的应用做性能优化，一方面提升系统性能，另外一方面对腐化的代码进行清理。本文结合业务平台性能优化的经验，探讨一下性能优化的思路及常用工具及手段。

岱泽

75,570

张玉峰

2024-05-15

626

如何使用SASE快速构建零信任架构

企业构建零信任架构已经成为近年热门的话题之一。本质都是保护企业核心数据安全，防止未经合法授权的数据的访问行为。阿里云SASE依托于阿里云的网络组网优势，为用户提供一个稳定、高效的SD-WAN组网及接入能力，与此同时叠加安全能力。

张玉峰

626

问思望宸

2024-08-12

7718

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

本文分享了作为一款全能型网关【云原生 API 网关】是如何帮助企业落地统一网关架构的。

问思望宸

7,718

隆基

2024-05-15

108498

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

本文主要学习 RocketMQ 的一致性特性，一致性对于交易、金融都是刚需。从大规模复杂业务出发，学习 RocketMQ 的 SQL 订阅、定时消息等特性。再从高可用的角度来看，这里更多的是大型公司对于高阶可用性的要求，如同城容灾、异地多活等。

隆基

108,498

执少

2024-05-15

716

阿里云千亿规模实时日志分析的架构设计和实践

本文为阿里云SLS 执少在《DataFunTalk技术交流会：阿里云实时查询分析专场》分享时的议题内容（文字版本）。首先，阿里云日志服务SLS是一个什么样的产品和服务呢？我们用一句话来概括的话，那就是我们是一个云上的、一站式的、可观测日志服务平台。首先呢，我们提供了强大的日志数据采集能力，支持...

执少

716

阿里云实时数仓Hologres

2024-06-07

128862

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01

阿里云实时数仓Hologres

128,862

云服务器ECS

2023-10-17

798

使用ECS部署并使用Docker

本文介绍如何在云服务ECS实例上，部署并使用Docker。

云服务器ECS

798

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

PolarDB-X的TPC-H列存执行计划

总结｜性能优化思路及常用工具及手段

如何使用SASE快速构建零信任架构

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

阿里云千亿规模实时日志分析的架构设计和实践

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01

使用ECS部署并使用Docker