官方博客-第22页-阿里云开发者社区

ModelScope

2024-05-15

1127

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,127

ModelScope

2024-05-15

1107

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,107

赵世振

2024-08-21

1443

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

通过使用阿里云百炼平台，您可以快速构建一个多代理（Multi-Agent）架构的智能导购助手。该助手能够通过多轮互动了解顾客的具体需求，收集详细信息后，利用阿里云百炼的知识检索增强功能或已有的商品数据库进行商品搜索，为顾客推荐最合适的产品。

赵世振

1,443

资源编排ROS

2024-09-10

216

ROS CDK魔法书：建立你的游戏王国（TypeScript篇）

在虚拟游戏的世界里，数字化的乐趣谱写着无数玩家的回忆。本文将指导您使用阿里云ROS CDK轻松将2048小游戏部署到云端。ROS CDK是一种强大的工具，允许您使用熟悉的编程语言定义和部署云资源，简化开发流程。此外，ECS（弹性计算服务）为您提供灵活且可扩展的计算资源，确保应用稳定运行。通过简单的环境配置和依赖安装，您可以快速创建和管理云资源，实现从本地到云端的无缝迁移。跟随本文指引，您将学会如何使用ROS CDK和ECS部署2048小游戏，并享受云端游戏的乐趣。

资源编排ROS

216

刘佳旭冯诗淳竺夏栋麻嘉豪隋吉智等

2024-12-25

612

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

聚焦近日OpenAI的大规模K8s集群故障，介绍阿里云容器服务与可观测团队在大规模K8s场景下我们的建设与沉淀。以及分享对类似故障问题的应对方案：包括在K8s和Prometheus的高可用架构设计方面、事前事后的稳定性保障体系方面。

刘佳旭冯诗淳竺夏栋麻嘉豪隋吉智等

612

望雲十雨言澈

2025-04-10

524

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

524

阿里云基础设施.

2025-05-01

357

ACK AI Profiling：从黑箱到透明的问题剖析

本文从一个通用的客户问题出发，描述了一个问题如何从前置排查到使用AI Profiling进行详细的排查，最后到问题定位与解决、业务执行过程的分析，从而展现一个从黑箱到透明的精细化的剖析过程。

阿里云基础设施.

357

资源编排ROS

2019-12-24

2171

资源编排ROS之自定制资源（多云部署Terraform篇）

资源编排服务（Resource Orchestration Service，简称ROS）是阿里云提供的一项简化云计算资源管理的服务。您可以遵循ROS定义的模板规范编写资源栈模板，在模板中定义所需的云计算资源（例如ECS实例、RDS数据库实例）、资源间的依赖关系等。

资源编排ROS

2,171

栾枝

2023-07-18

131006

手把手教你使用OSS-HDFS服务平替自建HDFS

本文主要介绍了OSS-HDFS服务以及使用OSS-HDFS服务平替自建HDFS。

栾枝

131,006

官方博客-第22页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

LISA微调技术解析：比LoRA更低的显存更快的速度

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

ROS CDK魔法书：建立你的游戏王国（TypeScript篇）

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

AI Infra之模型显存管理分析

ACK AI Profiling：从黑箱到透明的问题剖析

资源编排ROS之自定制资源（多云部署Terraform篇）

手把手教你使用OSS-HDFS服务平替自建HDFS

官方博客-第22页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

LISA微调技术解析：比LoRA更低的显存更快的速度

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

ROS CDK魔法书：建立你的游戏王国（TypeScript篇）

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

AI Infra之模型显存管理分析

ACK AI Profiling：从黑箱到透明的问题剖析

资源编排ROS之自定制资源（多云部署Terraform篇）

手把手教你使用OSS-HDFS服务平替自建HDFS