子白

2024-05-15

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,039

阿里云存储

2024-05-15

138729

用软硬协同设计下的飞天盘古降低存储系统开销

历经 15 载，如今的飞天盘古系统已迭代至第三代，数千万行代码和 1,000 余项专利，从大规模、到高性能、到高效能的分布式存储系统的演进，更高效地让数据中心成为一台计算机。

阿里云存储

138,729

孟威

2024-05-15

104178

SLS 大模型可观测&安全推理审计标准解决方案

本文介绍大模型可观测&安全推理审计解决方案和Demo演示，SLS 提供全面的 LLM 监控和日志记录功能。监控大模型使用情况和性能，自定义仪表盘；SLS 汇总 Actiontrail 事件、云产品可观测日志、LLM 网关明细日志、详细对话明细日志、Prompt Trace 和推理实时调用明细等数据，建设完整统一的大模型可观测方案，为用户的大模型安全推理审计提供全面合规支持。

孟威

104,178

斜阳

2024-05-15

132450

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

斜阳

132,450

澄潭望宸

2024-07-22

275

AI 时代，网关更能打了

随着互联网从 Web 2.0 迈进到 AI 时代，用户和互联网的交互方式，AI 时代下互联网的内容生产流程都发生了显著的转变，这对基础设施（Infra）提出了新的诉求，也带来了新的机遇。Infra 包含的内容非常丰富，本文仅从网关层面分享笔者的所见所感所悟。

澄潭望宸

275

阿里云云原生

2024-07-29

114

从供应商深度绑定，到走向真正的云原生，他们是这样做的

没有 K8s 的运维权限，开发者也能排查和定位问题。

阿里云云原生

114

隆基

2024-05-15

108409

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

本文主要学习 RocketMQ 的一致性特性，一致性对于交易、金融都是刚需。从大规模复杂业务出发，学习 RocketMQ 的 SQL 订阅、定时消息等特性。再从高可用的角度来看，这里更多的是大型公司对于高阶可用性的要求，如同城容灾、异地多活等。

隆基

108,409

杨永

2024-05-15

92643

使用KMS为MSE-Nacos敏感配置加密的最佳实践

本文主要介绍通过KMS密钥管理服务产生的密钥对敏感的AK等数据进行加密之后可以有效解决泄漏带来的安全风险问题，其次通过KMS凭据托管的能力直接将MSE的主AK进行有效管理，保障全链路无AK的业务体验，真正做到安全、可控。

杨永

92,643

徽泠

2024-06-27

33341

基于阿里云 OpenAPI 插件，让 Grafana 轻松实现云上数据可视化

本文旨在提供一个指导性的框架，帮助用户了解插件的安装、配置以及探索如何通过 Grafana 内的阿里云 OpenAPI 插件来对云上数据进行可视化和快速验证开发原型，加强数据可视化和云监控能力，助力开发速度。

徽泠

33,341

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

用软硬协同设计下的飞天盘古降低存储系统开销

SLS 大模型可观测&安全推理审计标准解决方案

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

AI 时代，网关更能打了

从供应商深度绑定，到走向真正的云原生，他们是这样做的

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

使用KMS为MSE-Nacos敏感配置加密的最佳实践

基于阿里云 OpenAPI 插件，让 Grafana 轻松实现云上数据可视化