官方博客-第5页-阿里云开发者社区

子白

2024-05-15

102600

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,600

片风

2025-01-14

629

政采云业务网关实践：使用 Higress 统一替代 APISIX/Kong/Istio Ingress

政采云基础架构团队技术专家朱海峰介绍了业务网关项目的背景和解决方案。

片风

629

孤弋孚阳

2025-05-07

584

破茧成蝶：阿里云应用服务器让传统 J2EE 应用无缝升级 AI 原生时代

本文详细介绍了阿里云应用服务器如何助力传统J2EE应用实现智能化升级。文章分为三部分：第一部分阐述了传统J2EE应用在智能化转型中的痛点，如协议鸿沟、资源冲突和观测失明；第二部分展示了阿里云应用服务器的解决方案，包括兼容传统EJB容器与微服务架构、支持大模型即插即用及全景可观测性；第三部分则通过具体步骤说明如何基于EDAS开启J2EE应用的智能化进程，确保十年代码无需重写，轻松实现智能化跃迁。

孤弋孚阳

584

吴昆

2024-05-15

222169

Kube Queue：Kubernetes 任务排队的利器

吴昆

222,169

言澈

2025-02-28

1307

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,307

恶来

2023-05-15

7587

消息队列之 MetaQ 和 Kafka 区别和优势详解

本篇文章介绍MetaQ和Kafka这两个消息队列的区别和优势。

恶来

7,587

张佐玮

2023-12-01

1659

Koordinator 助力云原生应用性能提升，小红书混部技术实践

本文基于 2023 云栖大会上关于 Koordinator 分享的实录，介绍小红书通过规模化落地混部技术来大幅提升集群资源效能，降低业务资源成本。

张佐玮

1,659

澄潭钰诚

2024-07-19

22038

Higress 重磅更新：AI 能力全面开源，云原生能力再升级

Higress 最新的 1.4 版本基于为通义千问，以及多家云上 AGI 厂商客户提供 AI 网关的积累沉淀，开源了大量 AI 原生的网关能力。同时也在 Ingress、可观测、流控等云原生能力上做了全方位升级。

澄潭钰诚

22,038

楠瑆

2024-12-09

637

ARMS 用户体验监控正式发布原生鸿蒙应用 SDK

阿里云 ARMS 用户体验监控（RUM）推出了针对原生鸿蒙应用的 SDK。SDK 使用 ArkTS 语言开发，支持页面采集、资源加载采集、异常采集及自定义采集等功能，能够全面监控鸿蒙应用的表现。集成简单，只需几步即可将 SDK 接入项目中，为鸿蒙应用的开发者提供了强有力的支持。

楠瑆

637

官方博客-第5页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

政采云业务网关实践：使用 Higress 统一替代 APISIX/Kong/Istio Ingress

破茧成蝶：阿里云应用服务器让传统 J2EE 应用无缝升级 AI 原生时代

Kube Queue：Kubernetes 任务排队的利器

进行GPU算力管理

消息队列之 MetaQ 和 Kafka 区别和优势详解

Koordinator 助力云原生应用性能提升，小红书混部技术实践

Higress 重磅更新：AI 能力全面开源，云原生能力再升级

ARMS 用户体验监控正式发布原生鸿蒙应用 SDK

官方博客-第5页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

政采云业务网关实践：使用 Higress 统一替代 APISIX/Kong/Istio Ingress

破茧成蝶：阿里云应用服务器让传统 J2EE 应用无缝升级 AI 原生时代

Kube Queue：Kubernetes 任务排队的利器

进行GPU算力管理

消息队列之 MetaQ 和 Kafka 区别和优势详解

Koordinator 助力云原生应用性能提升，小红书混部技术实践

Higress 重磅更新：AI 能力全面开源，云原生能力再升级

ARMS 用户体验监控正式发布原生鸿蒙应用 SDK