官方博客-第20页-阿里云开发者社区

阿里云云原生

2025-06-30

405

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

405

阿里云实时数仓Hologres

2022-12-06

1626

升级JSONB列式存储，Hologres助力淘宝搜索2022双11降本增效

升级JSONB列式存储，Hologres助力淘宝搜索2022双11降本增效。

阿里云实时数仓Hologres

1,626

隽驰

2022-12-28

1604

阿里CCO基于Hologres的亿级明细BI探索分析实践

阿里CCO基于Hologres的亿级明细BI探索分析实践。

隽驰

1,604

ModelScope

2024-05-15

921

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

921

ModelScope

2024-05-15

1127

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,127

赵世振

2024-08-21

1443

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

通过使用阿里云百炼平台，您可以快速构建一个多代理（Multi-Agent）架构的智能导购助手。该助手能够通过多轮互动了解顾客的具体需求，收集详细信息后，利用阿里云百炼的知识检索增强功能或已有的商品数据库进行商品搜索，为顾客推荐最合适的产品。

赵世振

1,443

喻奎

2024-08-23

284

MaxCompute 近实时增全量处理一体化新架构和使用场景介绍

本文主要介绍基于 MaxCompute 的离线近实时一体化新架构如何来支持这些综合的业务场景，提供基于Delta Table的近实时增全量一体的数据存储和计算解决方案。

喻奎

284

舟谨

2024-12-13

443

如何提取手写票据信息

本文主要讲述在处理票据信息结构化提取任务时，如何结合OCR（光学字符识别）技术和多模态大模型Qwen-VL来提高票据信息提取的准确性和效率。

舟谨

443

阿里云云原生

2025-01-22

596

AI 短剧遇上函数计算，一键搭建内容创意平台

为了帮助更多内容创作者和企业快速实现 AI 短剧创作，函数计算 FC 联合百炼联合推出“AI 剧本生成与动画创作解决方案”，通过函数计算 FC 构建 Web 服务，结合百炼模型服务和 ComfyUI 生图平台，实现从故事剧本撰写、插图设计、声音合成和字幕添加到视频合成的一站式自动化流程。创作者只需通过简单操作，就能快速生成高质量的剧本，并一键转化为精美的动画。

阿里云云原生

596

官方博客-第20页-阿里云开发者社区

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

升级JSONB列式存储，Hologres助力淘宝搜索2022双11降本增效

阿里CCO基于Hologres的亿级明细BI探索分析实践

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

vLLM部署Yuan2.0：高吞吐、更便捷

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

MaxCompute 近实时增全量处理一体化新架构和使用场景介绍

如何提取手写票据信息

AI 短剧遇上函数计算，一键搭建内容创意平台

官方博客-第20页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

升级JSONB列式存储，Hologres助力淘宝搜索2022双11降本增效

阿里CCO基于Hologres的亿级明细BI探索分析实践

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

vLLM部署Yuan2.0：高吞吐、更便捷

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

MaxCompute 近实时增全量处理一体化新架构和使用场景介绍

如何提取手写票据信息

AI 短剧遇上函数计算，一键搭建内容创意平台