阿里云云原生

2024-09-02

基于 RocketMQ 的云原生 MQTT 消息引擎设计

本文将介绍阿里云如何将 Serverless 架构应用于消息队列，有效降低运营成本，同时利用云原生环境的特性，为 IoT 设备提供快速响应和灵活伸缩的通讯能力。

阿里云云原生

98

子白

2024-05-15

101232

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,232

灵杰开发者

2024-08-22

17466

Apache Paimon V0.9最新进展

Apache Paimon V0.9 版本即将发布，此版本带来了多项新特性并解决了关键挑战。Paimon自2022年从Flink社区诞生以来迅速成长，已成为Apache顶级项目，并广泛应用于阿里集团内外的多家企业。

灵杰开发者

17,466

骆天

2024-05-15

981

高并发架构设计三大利器：缓存、限流和降级

软件系统有三个追求：高性能、高并发、高可用，俗称三高。本篇讨论高并发，从高并发是什么到高并发应对的策略、缓存、限流、降级等。

骆天

981

景祁

2024-05-15

163334

设计与构建 FinOps 流程、团队、体系与目标

企业 FinOps 实施不是一蹴而就的项目，如果您正在推进企业云原生 FinOps 落地，除了选择合适的技术手段，企业内部的流程和体系建设也尤为重要。

景祁

163,334

坤硕

2024-07-29

17729

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

基于大语言模型的应用在性能、成本、效果等方面存在一系列实际痛点，本文通过分析 LLM 应用模式以及关注点差异来阐明可观测技术挑战，近期阿里云可观测推出了面向 LLM 应用的可观测解决方案以及最佳实践，一起来了解下吧。

坤硕

17,729

望宸彦林

2024-06-24

50724

从云原生视角看 AI 原生应用架构的实践

本文核心观点： • 基于大模型的 AI 原生应用将越来越多，容器和微服务为代表的云原生技术将加速渗透传统业务。 • API 是 AI 原生应用的一等公民，并引入了更多流量，催生企业新的生命力和想象空间。 • AI 原生应用对网关的需求超越了传统的路由和负载均衡功能，承载了更大的 AI 工程化使命。 • AI Infra 的一致性架构至关重要，API 网关、消息队列、可观测是 AI Infra 的重要组成。

望宸彦林

50,724

阿里云实时数仓Hologres

2024-06-27

1689

实时数仓Hologres OLAP场景核心能力介绍

Hologres提供统一、实时、弹性、易用的一站式实时数仓引擎，解决复杂OLAP难题。

阿里云实时数仓Hologres

1,689

阿里云实时数仓Hologres

2024-06-07

128838

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01

阿里云实时数仓Hologres

128,838

类目筛选

内容类型

基于 RocketMQ 的云原生 MQTT 消息引擎设计

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Apache Paimon V0.9最新进展

高并发架构设计三大利器：缓存、限流和降级

设计与构建 FinOps 流程、团队、体系与目标

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

从云原生视角看 AI 原生应用架构的实践

实时数仓Hologres OLAP场景核心能力介绍

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01