子白

2024-05-15

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

100,835

抱泽

2024-05-15

135

Kubernetes 文件采集实践：Sidecar + hostPath 卷

在Kubernetes 日志查询分析实践中，我们介绍了如何通过 DaemonSet 方式部署 logtail 并采集标准输出/文件两种形式的数据。DaemonSet 部署的优势在于其能够尽可能地减少采集 agent 所占用的资源且支持标准输出采集，但因为每个 DaemonSet pod 需要负责 n...

抱泽

135

隆基

2024-05-15

140490

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

了解 RocketMQ 5.0 的核心概念和架构概览；然后我们会从集群角度出发，从宏观视角学习 RocketMQ 的管控链路、数据链路、客户端和服务端如何交互；学习 RocketMQ 如何实现数据的存储，数据的高可用，如何利用云原生存储进一步提升竞争力。

隆基

140,490

阿里云云原生

2024-06-13

612

阿里云微服务引擎及 API 网关 2024 年 5 月产品动态

阿里云微服务引擎及 API 网关 2024 年 5 月产品动态。

阿里云云原生

612

祎程

2024-06-19

165

通过OOS定时升级Redis实例临时带宽

阿里云OOS提供了定时升级Redis实例临时带宽的功能，以应对数据驱动业务中的流量高峰。这个功能允许用户根据预测的业务负载，在特定日期和时间自动增加Redis实例的带宽，确保服务性能和稳定性。在高流量事件结束后，带宽会自动恢复到原设置，节省成本。此功能适用于电商平台促销、大型游戏更新等场景，确保在流量高峰期间的系统稳定运行。

祎程

165

云服务器ECS

2023-10-17

634

使用ECS部署并使用Docker

本文介绍如何在云服务ECS实例上，部署并使用Docker。

云服务器ECS

634

隆基

2024-05-15

108322

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

本文主要学习 RocketMQ 的一致性特性，一致性对于交易、金融都是刚需。从大规模复杂业务出发，学习 RocketMQ 的 SQL 订阅、定时消息等特性。再从高可用的角度来看，这里更多的是大型公司对于高阶可用性的要求，如同城容灾、异地多活等。

隆基

108,322

吴昆

2024-05-15

145393

弹性调度助力企业灵活应对业务变化，高效管理云上资源

本文主要介绍了弹性调企业灵活应对企业业务变化，并高效管理云上资源。

吴昆

145,393

阿里云云原生

2024-05-22

59981

基于 Prometheus 的超算弹性计算场景下主机监控最佳实践

超算快速弹性伸缩场景下，如何构建一套准确、快速、可靠的监控体系成为关键点。阿里云在超算场景的主机监控落地实践，解决超算场景面临的挑战，交付一套可靠和全面的主机监控体系。

阿里云云原生

59,981

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Kubernetes 文件采集实践：Sidecar + hostPath 卷

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

阿里云微服务引擎及 API 网关 2024 年 5 月产品动态

通过OOS定时升级Redis实例临时带宽

使用ECS部署并使用Docker

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

弹性调度助力企业灵活应对业务变化，高效管理云上资源

基于 Prometheus 的超算弹性计算场景下主机监控最佳实践