官方博客-第15页-阿里云开发者社区

荣阳

2025-02-28

1058

使用A10单卡24G复现DeepSeek R1强化学习过程

本文描述DeepSeek的三个模型的学习过程，其中DeepSeek-R1-Zero模型所涉及的强化学习算法，是DeepSeek最核心的部分之一会重点展示。

荣阳

1,058

望雲十雨言澈

2025-04-10

581

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

581

阿里云云原生

2025-06-30

440

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

440

ModelScope

2024-05-15

1153

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,153

垚佳汐遥

2024-10-23

1046

通义灵码知识库问答增强：知识库构建与管理指南

通义灵码能够结合企业知识库的私域数据，生成贴合企业特点的回答。充分发挥检索增强技术的优势，构建高质量的企业知识数据以及合理的知识库权限管理是必不可少的。本文将为您详细介绍如何构造与管理一个高质量的企业知识库。

垚佳汐遥

1,046

阿里云云原生

2024-12-17

864

10 分钟打造你的专属 AI 客服

在这个数字化时代，提供卓越的客户服务已成为企业脱颖而出的关键。为了满足这一需求，越来越多的企业开始探索人工智能（AI）助手的应用，以实现全天候（7x24）的客户咨询响应，全面提升用户体验和业务竞争力。本解决方案通过函数计算FC 和大模型服务平台百炼，为您提供一个高效便捷构建 AI 助手思路。

阿里云云原生

864

探索云世界

2025-01-02

410

云端问道11期实践教学-创建专属AI助手

本次分享意在帮助用户更加全面、深入地了解百炼的核心产品能力，并通过实际操作学会如何快速将大模型与自己的系统及应用相结合。主要包括以下三个方面： 1. 阿里云百炼产品定位和能力简介 2. 知识检索 RAG 智能体应用能力和优势 3. 最佳落地案例实践分享

探索云世界

410

张智超

2025-02-07

479

巧用通义灵码，提升前端研发效率

本次分享，主题是利用通义灵码提升前端研发效率。分享内容主要包括以下几部分：首先，我将从前端开发的角度介绍对通义灵码的基本认识；其次，我将展示通义灵码在日常研发中的应用案例；然后，我将通过实例说明，良好的设计能够显著提升通义灵码的效果。在第四个部分，我将介绍通义灵码的企业知识库以及如何利用 RAG 构建团队智能研发助手。最后，我将总结本次分享并展望未来方向。

张智超

479

望宸

2025-02-20

677

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

677

官方博客-第15页-阿里云开发者社区

类目筛选

内容类型

使用A10单卡24G复现DeepSeek R1强化学习过程

AI Infra之模型显存管理分析

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

LISA微调技术解析：比LoRA更低的显存更快的速度

通义灵码知识库问答增强：知识库构建与管理指南

10 分钟打造你的专属 AI 客服

云端问道11期实践教学-创建专属AI助手

巧用通义灵码，提升前端研发效率

大模型推理服务全景图

官方博客-第15页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

使用A10单卡24G复现DeepSeek R1强化学习过程

AI Infra之模型显存管理分析

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

LISA微调技术解析：比LoRA更低的显存更快的速度

通义灵码知识库问答增强：知识库构建与管理指南

10 分钟打造你的专属 AI 客服

云端问道11期实践教学-创建专属AI助手

巧用通义灵码，提升前端研发效率

大模型推理服务全景图