官方博客-第24页-阿里云开发者社区

荣阳

2025-02-28

1020

使用A10单卡24G复现DeepSeek R1强化学习过程

本文描述DeepSeek的三个模型的学习过程，其中DeepSeek-R1-Zero模型所涉及的强化学习算法，是DeepSeek最核心的部分之一会重点展示。

荣阳

1,020

ModelScope

2025-06-16

496

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

生成式模型在文本生成图片等领域的快速发展，为社区带来了日新月异的诸多文生图模型。

ModelScope

496

阿里云云原生

2025-06-30

405

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

405

查斌

2023-04-14

577

如何在 Anolis 8 上构建基于 Nydus 和 Dragonfly 的镜像加速解决方案

Nydus+Dragonfly 组合减少容器启动过程中镜像的拉取时间，提升集群间的镜像分发效率。

查斌

577

探索云世界

2024-05-15

40598

不需要懂技术，3分钟幻兽帕鲁服务器搭建教程

幻兽帕鲁最近非常火。有些小伙伴可能不喜欢跟陌生人一起玩，那么你可以搭建一个专有服务器和朋友一起联机游戏。自己搭建服务器不仅更私密，还能自定义游戏里的一些选项，比如调整工作速度倍率、经验获取倍率等。这篇教程将引导你在几分钟内快速完成幻兽帕鲁服务器的搭建。

探索云世界

40,598

雅纯

2024-05-15

121882

云效AppStack+阿里云MSE实现应用服务全链路灰度

在应用开发测试验证通过后、进行生产发布前，为了降低新版本发布带来的风险，期望能够先部署到灰度环境，用小部分业务流量进行全链路灰度验证，验证通过后再全量发布生产。本文主要介绍如何通过阿里云MSE 微服务引擎和云效应用交付平台AppStack 实现灰度发布。

雅纯

121,882

ModelScope

2024-05-15

1127

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,127

遥方

2024-05-15

381

多账号共享一套ACR方案

一家多业务组织的客户来说往往会有多个云账号，分别部署各个业务线的容器服务。但集团可能想使用一套统一的容器镜像仓库（ACR），就会面临多账号内多个ACK共享一套ACR了。那如何合理规划好ACR实例上的命名空间，打通各个业务ACK集群与ACR的网络，包括如何精细化授权，都是客户需要考虑的。

遥方

381

ModelScope

2024-05-15

1107

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,107

官方博客-第24页-阿里云开发者社区

类目筛选

内容类型

使用A10单卡24G复现DeepSeek R1强化学习过程

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

如何在 Anolis 8 上构建基于 Nydus 和 Dragonfly 的镜像加速解决方案

不需要懂技术，3分钟幻兽帕鲁服务器搭建教程

云效AppStack+阿里云MSE实现应用服务全链路灰度

vLLM部署Yuan2.0：高吞吐、更便捷

多账号共享一套ACR方案

LISA微调技术解析：比LoRA更低的显存更快的速度

官方博客-第24页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

使用A10单卡24G复现DeepSeek R1强化学习过程

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

如何在 Anolis 8 上构建基于 Nydus 和 Dragonfly 的镜像加速解决方案

不需要懂技术，3分钟幻兽帕鲁服务器搭建教程

云效AppStack+阿里云MSE实现应用服务全链路灰度

vLLM部署Yuan2.0：高吞吐、更便捷

多账号共享一套ACR方案

LISA微调技术解析：比LoRA更低的显存更快的速度