子白

2024-05-15

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

100,821

抱泽

2024-05-15

135

Kubernetes 文件采集实践：Sidecar + hostPath 卷

在Kubernetes 日志查询分析实践中，我们介绍了如何通过 DaemonSet 方式部署 logtail 并采集标准输出/文件两种形式的数据。DaemonSet 部署的优势在于其能够尽可能地减少采集 agent 所占用的资源且支持标准输出采集，但因为每个 DaemonSet pod 需要负责 n...

抱泽

135

荆磊

2024-05-15

55596

更优性能与性价比，从自建 ELK 迁移到 SLS 开始

本文介绍了 SLS 基本能力，并和开源自建 ELK 做了对比，可以看到 SLS 相比开源 ELK 有较大优势。

荆磊

55,596

隆基

2024-05-15

140479

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

了解 RocketMQ 5.0 的核心概念和架构概览；然后我们会从集群角度出发，从宏观视角学习 RocketMQ 的管控链路、数据链路、客户端和服务端如何交互；学习 RocketMQ 如何实现数据的存储，数据的高可用，如何利用云原生存储进一步提升竞争力。

隆基

140,479

阿里云云原生

2024-06-13

611

阿里云微服务引擎及 API 网关 2024 年 5 月产品动态

阿里云微服务引擎及 API 网关 2024 年 5 月产品动态。

阿里云云原生

611

祎程

2024-06-19

162

通过OOS定时升级Redis实例临时带宽

阿里云OOS提供了定时升级Redis实例临时带宽的功能，以应对数据驱动业务中的流量高峰。这个功能允许用户根据预测的业务负载，在特定日期和时间自动增加Redis实例的带宽，确保服务性能和稳定性。在高流量事件结束后，带宽会自动恢复到原设置，节省成本。此功能适用于电商平台促销、大型游戏更新等场景，确保在流量高峰期间的系统稳定运行。

祎程

162

云服务器ECS

2023-10-17

632

使用ECS部署并使用Docker

本文介绍如何在云服务ECS实例上，部署并使用Docker。

云服务器ECS

632

吴昆

2024-05-15

145392

弹性调度助力企业灵活应对业务变化，高效管理云上资源

本文主要介绍了弹性调企业灵活应对企业业务变化，并高效管理云上资源。

吴昆

145,392

豁朗

2024-05-15

125352

弱结构化日志 Flink SQL 怎么写？SLS SPL 来帮忙

豁朗

125,352

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Kubernetes 文件采集实践：Sidecar + hostPath 卷

更优性能与性价比，从自建 ELK 迁移到 SLS 开始

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

阿里云微服务引擎及 API 网关 2024 年 5 月产品动态

通过OOS定时升级Redis实例临时带宽

使用ECS部署并使用Docker

弹性调度助力企业灵活应对业务变化，高效管理云上资源

弱结构化日志 Flink SQL 怎么写？SLS SPL 来帮忙