官方博客-第18页-阿里云开发者社区

ModelScope

2024-05-15

1184

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,184

阿里云实时数仓Hologres

2024-06-27

2999

实时数仓Hologres OLAP场景核心能力介绍

Hologres提供统一、实时、弹性、易用的一站式实时数仓引擎，解决复杂OLAP难题。

阿里云实时数仓Hologres

2,999

易定

2024-12-06

1062

【实战干货】AI大模型工程应用于车联网场景的实战总结

本文介绍了图像生成技术在AIGC领域的发展历程、关键技术和当前趋势，以及这些技术如何应用于新能源汽车行业的车联网服务中。

易定

1,062

阿里云云原生

2025-06-30

443

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

443

弃余

2023-08-11

1559

Linux 内存管理新特性：Memory folios 解读

本文主要讲解folio ，极其在应用中的直接价值。

弃余

1,559

赫曦

2024-05-15

93222

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

本文主要介绍了通过弹性，实现成本优化，解决集群资源利用率难题。

赫曦

93,222

ModelScope

2024-05-15

1240

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,240

阿里云云原生

2024-09-02

701

西游再现，一键部署 Flux 文生图大模型生成西游人物

从花果山的灵石出世，到取经路上的九九八十一难，再到大闹天宫的惊心动魄……这些耳熟能详的西游场景，如今都能通过 Flux 模型，以超乎想象的细节和真实感呈现在你眼前。本次实验在函数计算中内置的 flux.1-dev-fp8 大模型，搭配 Lora 模型，无需复杂的配置，一键部署，你就能成为这场视觉盛宴的创造者。

阿里云云原生

701

探索云世界

2025-01-02

415

云端问道11期实践教学-创建专属AI助手

本次分享意在帮助用户更加全面、深入地了解百炼的核心产品能力，并通过实际操作学会如何快速将大模型与自己的系统及应用相结合。主要包括以下三个方面： 1. 阿里云百炼产品定位和能力简介 2. 知识检索 RAG 智能体应用能力和优势 3. 最佳落地案例实践分享

探索云世界

415

官方博客-第18页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

实时数仓Hologres OLAP场景核心能力介绍

【实战干货】AI大模型工程应用于车联网场景的实战总结

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

Linux 内存管理新特性：Memory folios 解读

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

元象大模型开源30款量化版本加速低成本部署丨附教程

西游再现，一键部署 Flux 文生图大模型生成西游人物

云端问道11期实践教学-创建专属AI助手

官方博客-第18页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

实时数仓Hologres OLAP场景核心能力介绍

【实战干货】AI大模型工程应用于车联网场景的实战总结

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

Linux 内存管理新特性：Memory folios 解读

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

元象大模型开源30款量化版本 加速低成本部署丨附教程

西游再现，一键部署 Flux 文生图大模型生成西游人物

云端问道11期实践教学-创建专属AI助手

元象大模型开源30款量化版本加速低成本部署丨附教程