官方博客-第23页-阿里云开发者社区

阿里云云原生

2025-06-30

405

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

405

ModelScope

2024-05-15

921

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

921

阿里云瑶池数据库

2024-05-15

1953

众安保险 CDP 平台：借助阿里云数据库 SelectDB 版内核 Apache Doris 打破数据孤岛，人群圈选提速4倍

随着业务在金融、保险和商城领域的不断扩展，众安保险建设 CDP 平台以提供自动化营销数据支持。早期 CDP 平台依赖于 Spark + Impala + Hbase + Nebula 复杂的技术组合，这不仅导致数据分析形成数据孤岛，还带来高昂的管理及维护成本。为解决该问题，众安保险引入 Apache Doris，替换了早期复杂的技术组合，不仅降低了系统的复杂性，打破了数据孤岛，更提升了数据处理的效率。

阿里云瑶池数据库

1,953

ModelScope

2024-05-15

1127

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,127

陈浩章颖强

2024-05-29

55697

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

PolarDB Serverless如何在0.5秒内实现跨机迁移？

陈浩章颖强

55,697

杨逍

2024-07-04

474

现已开源｜有这款神器，业务0改动即可实现数据加密

全密态Go驱动开源啦

杨逍

474

阿里云瑶池数据库

2024-08-13

748

7倍性能提升｜阿里云AnalyticDB Spark向量化能力解析

AnalyticDB Spark如何通过向量化引擎提升性能？

阿里云瑶池数据库

748

赵世振

2024-08-21

1443

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

通过使用阿里云百炼平台，您可以快速构建一个多代理（Multi-Agent）架构的智能导购助手。该助手能够通过多轮互动了解顾客的具体需求，收集详细信息后，利用阿里云百炼的知识检索增强功能或已有的商品数据库进行商品搜索，为顾客推荐最合适的产品。

赵世振

1,443

资源编排ROS

2024-09-10

216

ROS CDK魔法书：建立你的游戏王国（TypeScript篇）

在虚拟游戏的世界里，数字化的乐趣谱写着无数玩家的回忆。本文将指导您使用阿里云ROS CDK轻松将2048小游戏部署到云端。ROS CDK是一种强大的工具，允许您使用熟悉的编程语言定义和部署云资源，简化开发流程。此外，ECS（弹性计算服务）为您提供灵活且可扩展的计算资源，确保应用稳定运行。通过简单的环境配置和依赖安装，您可以快速创建和管理云资源，实现从本地到云端的无缝迁移。跟随本文指引，您将学会如何使用ROS CDK和ECS部署2048小游戏，并享受云端游戏的乐趣。

资源编排ROS

216

官方博客-第23页-阿里云开发者社区

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

众安保险 CDP 平台：借助阿里云数据库 SelectDB 版内核 Apache Doris 打破数据孤岛，人群圈选提速4倍

vLLM部署Yuan2.0：高吞吐、更便捷

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

现已开源｜有这款神器，业务0改动即可实现数据加密

7倍性能提升｜阿里云AnalyticDB Spark向量化能力解析

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

ROS CDK魔法书：建立你的游戏王国（TypeScript篇）

官方博客-第23页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

众安保险 CDP 平台：借助阿里云数据库 SelectDB 版内核 Apache Doris 打破数据孤岛，人群圈选提速4倍

vLLM部署Yuan2.0：高吞吐、更便捷

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

现已开源｜有这款神器，业务0改动即可实现数据加密

7倍性能提升｜阿里云AnalyticDB Spark向量化能力解析

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

ROS CDK魔法书：建立你的游戏王国（TypeScript篇）