子白

2024-05-15

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

100,820

吴昆

2024-05-15

145392

弹性调度助力企业灵活应对业务变化，高效管理云上资源

本文主要介绍了弹性调企业灵活应对企业业务变化，并高效管理云上资源。

吴昆

145,392

豁朗

2024-05-15

125352

弱结构化日志 Flink SQL 怎么写？SLS SPL 来帮忙

豁朗

125,352

豁朗

2021-08-13

1666

用SLS配置日志关键字告警的N种方法

本文主要介绍一种免运维，高性能，支持灵活配置的方案，使用SLS接入日志和告警。

豁朗

1,666

非有

2024-05-15

876

一文详解 Java 限流接口实现

本文介绍的实现方式属于应用级限制，应用级限流方式只是单应用内的请求限流，不能进行全局限流。要保证系统的抗压能力，限流是一个必不可少的环节，虽然可能会造成某些用户的请求被丢弃，但相比于突发流量造成的系统宕机来说，这些损失一般都在可以接受的范围之内。

非有

876

豁朗

2022-05-16

1738

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

本文提供一种相对Sidecar部署更轻量级的采集方式，只需要部署少量的Logtail容器，即可采集不同业务容器的日志。

豁朗

1,738

史泽寰

2023-09-19

787

全网最细，深度解析 Istio Ambient Mesh 流量路径

本文旨在对 Istio Ambient Mesh 的流量路径进行详细解读，力求尽可能清晰地呈现细节，以帮助读者完全理解 Istio Ambient Mesh 中最为关键的部分。

史泽寰

787

张佐玮

2023-12-01

866

Koordinator 助力云原生应用性能提升，小红书混部技术实践

本文基于 2023 云栖大会上关于 Koordinator 分享的实录，介绍小红书通过规模化落地混部技术来大幅提升集群资源效能，降低业务资源成本。

张佐玮

866

阿里云云原生

2024-05-15

164889

OpenKruise v1.6 版本解读：增强多域管理能力

OpenKruise 在 2024.3 发布了最新的 v1.6 版本（ChangeLog），本文对新版本的核心特性做整体介绍。

阿里云云原生

164,889

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

弹性调度助力企业灵活应对业务变化，高效管理云上资源

弱结构化日志 Flink SQL 怎么写？SLS SPL 来帮忙

用SLS配置日志关键字告警的N种方法

一文详解 Java 限流接口实现

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

全网最细，深度解析 Istio Ambient Mesh 流量路径

Koordinator 助力云原生应用性能提升，小红书混部技术实践

OpenKruise v1.6 版本解读：增强多域管理能力