闵子

2023-12-01

从浏览器原理出发聊聊Chrome插件

本文从浏览器架构演进、插件运行机制、插件基本介绍和一些常见的插件实现思路几个方向聊聊Chrome插件。

闵子

1,055

子白

2024-05-15

101034

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,034

阿里云存储

2024-05-15

138728

用软硬协同设计下的飞天盘古降低存储系统开销

历经 15 载，如今的飞天盘古系统已迭代至第三代，数千万行代码和 1,000 余项专利，从大规模、到高性能、到高效能的分布式存储系统的演进，更高效地让数据中心成为一台计算机。

阿里云存储

138,728

澄潭望宸

2024-07-22

274

AI 时代，网关更能打了

随着互联网从 Web 2.0 迈进到 AI 时代，用户和互联网的交互方式，AI 时代下互联网的内容生产流程都发生了显著的转变，这对基础设施（Infra）提出了新的诉求，也带来了新的机遇。Infra 包含的内容非常丰富，本文仅从网关层面分享笔者的所见所感所悟。

澄潭望宸

274

阿里云云原生

2024-07-29

113

从供应商深度绑定，到走向真正的云原生，他们是这样做的

没有 K8s 的运维权限，开发者也能排查和定位问题。

阿里云云原生

113

孟威

2024-05-15

104176

SLS 大模型可观测&安全推理审计标准解决方案

本文介绍大模型可观测&安全推理审计解决方案和Demo演示，SLS 提供全面的 LLM 监控和日志记录功能。监控大模型使用情况和性能，自定义仪表盘；SLS 汇总 Actiontrail 事件、云产品可观测日志、LLM 网关明细日志、详细对话明细日志、Prompt Trace 和推理实时调用明细等数据，建设完整统一的大模型可观测方案，为用户的大模型安全推理审计提供全面合规支持。

孟威

104,176

斜阳

2024-05-15

132448

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

斜阳

132,448

正禾

2024-05-15

262

云防火墙初次开通使用最佳实践

云防火墙可以帮助用户在云上实现业务隔离和防护，确保业务安全和满足合规要求，如果您在购买云防火墙不知道如何使用，本文将从业务介绍新手如何结合业务更好的使用云防火墙。

正禾

262

启淮凡问

2024-07-16

11700

从一个服务预热不生效问题谈微服务无损上线

本文基于阿里云技术服务团队和产研团队，在解决易易互联使用 MSE（微服务引擎）产品无损上线功能所遇到问题的过程总结而成。本文将从问题和解决方法谈起，再介绍相关原理，后进一步拓展到对微服务引擎和云原生网关无损上线能力的介绍。

启淮凡问

11,700

类目筛选

内容类型

从浏览器原理出发聊聊Chrome插件

大语言模型推理提速，TensorRT-LLM 高性能推理实践

用软硬协同设计下的飞天盘古降低存储系统开销

AI 时代，网关更能打了

从供应商深度绑定，到走向真正的云原生，他们是这样做的

SLS 大模型可观测&安全推理审计标准解决方案

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

云防火墙初次开通使用最佳实践

从一个服务预热不生效问题谈微服务无损上线