官方博客-第11页-阿里云开发者社区

丕天

2025-03-21

1132

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,132

张佐玮

2023-12-01

1546

Koordinator 助力云原生应用性能提升，小红书混部技术实践

本文基于 2023 云栖大会上关于 Koordinator 分享的实录，介绍小红书通过规模化落地混部技术来大幅提升集群资源效能，降低业务资源成本。

张佐玮

1,546

赫曦

2024-05-15

93192

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

本文主要介绍了通过弹性，实现成本优化，解决集群资源利用率难题。

赫曦

93,192

ModelScope

2024-05-15

1155

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,155

龙蜥社区OpenAnolis

2024-11-06

2921

AI 场景下确保模型数据安全，Confidential AI 技术最佳实践解读

机密计算软硬结合技术保障数据安全。

龙蜥社区OpenAnolis

2,921

ModelScope

2025-06-16

544

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

生成式模型在文本生成图片等领域的快速发展，为社区带来了日新月异的诸多文生图模型。

ModelScope

544

刘佳旭

2023-09-26

138996

云原生场景下高可用架构的最佳实践

刘佳旭

138,996

子白

2024-05-15

102450

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,450

虎仔

2024-10-22

1181

最佳实践：通义灵码生成单元测试，让单测更简单

本文首先讲述了什么是单元测试、单元测试的价值、一个好的单元测试所具备的原则，进而引入如何去编写一个好的单元测试，通义灵码是如何快速生成单元测试的。

虎仔

1,181

官方博客-第11页-阿里云开发者社区

类目筛选

内容类型

AI 推理场景的痛点和解决方案

Koordinator 助力云原生应用性能提升，小红书混部技术实践

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

vLLM部署Yuan2.0：高吞吐、更便捷

AI 场景下确保模型数据安全，Confidential AI 技术最佳实践解读

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

云原生场景下高可用架构的最佳实践

大语言模型推理提速，TensorRT-LLM 高性能推理实践

最佳实践：通义灵码生成单元测试，让单测更简单

官方博客-第11页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

AI 推理场景的痛点和解决方案

Koordinator 助力云原生应用性能提升，小红书混部技术实践

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

vLLM部署Yuan2.0：高吞吐、更便捷

AI 场景下确保模型数据安全，Confidential AI 技术最佳实践解读

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

云原生场景下高可用架构的最佳实践

大语言模型推理提速，TensorRT-LLM 高性能推理实践

最佳实践：通义灵码生成单元测试，让单测更简单