子白

2024-05-15

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,025

休祯

2024-07-18

7520

流量回放新形态：基于网关 Access Log 发起

流量回放技术在性能测试和故障排除中至关重要。传统工具如 GoReplay、Tcpreplay 等存在高权限、配置复杂、登录态失效等痛点。PTS 推出基于 Access Log 的流量回放功能，自动生成压测场景，解决传统工具痛点，操作简单，一起来了解下吧~

休祯

7,520

扬流

2024-05-15

118011

Paimon 与 Spark 的集成（二）：查询优化

通过一系列优化，我们将 Paimon x Spark 在 TpcDS 上的性能提高了37+%，已基本和 Parquet x Spark 持平，本文对其中的关键优化点进行了详细介绍。

扬流

118,011

阿里云存储

2024-05-15

138723

用软硬协同设计下的飞天盘古降低存储系统开销

历经 15 载，如今的飞天盘古系统已迭代至第三代，数千万行代码和 1,000 余项专利，从大规模、到高性能、到高效能的分布式存储系统的演进，更高效地让数据中心成为一台计算机。

阿里云存储

138,723

言澈

2024-05-15

400

全景剖析阿里云容器网络数据链路（一）—— Flannel

本文是[全景剖析容器网络数据链路]第一部分，主要介绍Kubernetes Flannel模式下，数据面链路的转转发链路

言澈

400

致问

2023-09-15

119389

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

本文将会分享Hologres RoaringBitmap 方案在画像分析的应用实践，实现更快更准的画像分析。

致问

119,389

豁朗

2024-05-15

398

K8s挂载PVC日志采集“轻量级”玩法

本文介绍一种使用K8s挂载PVC日志采集时的轻量级部署方式。

豁朗

398

炎火

2024-05-15

251

安全防御四部曲-防护实践方案（多产品结合）

本篇内容为防护（Protection），检测（Detection），恢复（Recovery），响应（Response）实践方案四部曲之一，主要介绍如何结合多产品使用在阿里云国际站做好防护（Protection）部分的安全。

炎火

251

杨永

2024-05-15

636

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

针对Springboot里面使用开源工具使用加解密，替换成阿里云KMS产品进行加解密；

杨永

636

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

流量回放新形态：基于网关 Access Log 发起

Paimon 与 Spark 的集成（二）：查询优化

用软硬协同设计下的飞天盘古降低存储系统开销

全景剖析阿里云容器网络数据链路（一）—— Flannel

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

K8s挂载PVC日志采集“轻量级”玩法

安全防御四部曲-防护实践方案（多产品结合）

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能