子白

2024-05-15

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,080

古琦

2024-07-04

108306

全链路追踪 & 性能监控，GO 应用可观测全面升级

当前，大多数面向 Golang 应用的监控能力主要是通过 SDK 方式接入，需要开放人员手动进行埋点，会存在一定问题。对此，可观测 Go Agent 应运而生。本文介绍的阿里云可观测 Go Agent 方案，能通过无侵入的方式实现应用监控能力。

古琦

108,306

徒钟

2024-07-19

13384

Apache RocketMQ ACL 2.0 全新升级

RocketMQ 作为一款流行的分布式消息中间件，被广泛应用于各种大型分布式系统和微服务中，承担着异步通信、系统解耦、削峰填谷和消息通知等重要的角色。随着技术的演进和业务规模的扩大，安全相关的挑战日益突出，消息系统的访问控制也变得尤为重要。然而，RocketMQ 现有的 ACL 1.0 版本已经无法满足未来的发展。因此，我们推出了 RocketMQ ACL 2.0 升级版，进一步提升 RocketMQ 数据的安全性。本文将介绍 RocketMQ ACL 2.0 的新特性、工作原理，以及相关的配置和实践。

徒钟

13,384

阿里云瑶池数据库

2024-06-25

23104

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题

在今年的SIGMOD会议上，阿里云瑶池数据库团队的论文《PolarDB-MP: A Multi-Primary Cloud-Native Database via Disaggregated Shared Memory》获得了Industry Track Best Paper Award，这是中国企业独立完成的成果首次摘得SIGMOD最高奖。PolarDB-MP是基于分布式共享内存的多主云原生数据库，本文将介绍这篇论文的具体细节。

阿里云瑶池数据库

23,104

隆基

2024-05-15

140732

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

了解 RocketMQ 5.0 的核心概念和架构概览；然后我们会从集群角度出发，从宏观视角学习 RocketMQ 的管控链路、数据链路、客户端和服务端如何交互；学习 RocketMQ 如何实现数据的存储，数据的高可用，如何利用云原生存储进一步提升竞争力。

隆基

140,732

张玉峰

2024-05-15

522

如何使用SASE快速构建零信任架构

企业构建零信任架构已经成为近年热门的话题之一。本质都是保护企业核心数据安全，防止未经合法授权的数据的访问行为。阿里云SASE依托于阿里云的网络组网优势，为用户提供一个稳定、高效的SD-WAN组网及接入能力，与此同时叠加安全能力。

张玉峰

522

杨永

2024-05-15

92664

使用KMS为MSE-Nacos敏感配置加密的最佳实践

本文主要介绍通过KMS密钥管理服务产生的密钥对敏感的AK等数据进行加密之后可以有效解决泄漏带来的安全风险问题，其次通过KMS凭据托管的能力直接将MSE的主AK进行有效管理，保障全链路无AK的业务体验，真正做到安全、可控。

杨永

92,664

骆天

2024-05-15

871

高并发架构设计三大利器：缓存、限流和降级

软件系统有三个追求：高性能、高并发、高可用，俗称三高。本篇讨论高并发，从高并发是什么到高并发应对的策略、缓存、限流、降级等。

骆天

871

阿里云数据库

2024-05-15

82240

Ganos H3地理网格能力解析与最佳实践

本文介绍了Ganos H3的相关功能，帮助读者快速了解Ganos地理网格的重要特性与应用实践。H3是Uber研发的一种覆盖全球表面的二维地理网格，采用了一种全球统一的、多层次的六边形网格体系来表示地球表面，这种地理网格技术在诸多业务场景中得到广泛应用。Ganos不仅提供了H3网格的全套功能，还支持与其它Ganos时空数据类型进行跨模联合分析，极大程度提升了客户对于时空数据的挖掘分析能力。

阿里云数据库

82,240

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

全链路追踪 & 性能监控，GO 应用可观测全面升级

Apache RocketMQ ACL 2.0 全新升级

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

如何使用SASE快速构建零信任架构

使用KMS为MSE-Nacos敏感配置加密的最佳实践

高并发架构设计三大利器：缓存、限流和降级

Ganos H3地理网格能力解析与最佳实践