官方博客-第23页-阿里云开发者社区

ModelScope

2024-05-15

1143

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,143

寻剑

2024-09-11

341

表格存储低成本向量检索服务助力 AI 检索

本文阐述了阿里云表格存储（Tablestore）如何通过其向量检索服务应对大规模数据检索的需求，尤其是在成本、规模和召回率这三个关键挑战方面。

寻剑

341

明巍临城水德

2024-11-14

542

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

在本文中，作者介绍了 Lingma SWE-GPT，一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

明巍临城水德等

542

探索云世界

2025-01-02

400

云端问道11期实践教学-创建专属AI助手

本次分享意在帮助用户更加全面、深入地了解百炼的核心产品能力，并通过实际操作学会如何快速将大模型与自己的系统及应用相结合。主要包括以下三个方面： 1. 阿里云百炼产品定位和能力简介 2. 知识检索 RAG 智能体应用能力和优势 3. 最佳落地案例实践分享

探索云世界

400

正己

2025-01-06

343

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

Kubernetes 体系基于 DNS 的服务发现为开发者提供了很大的便利，但其高度复杂的架构往往带来更高的稳定性风险。以 Nacos 为代表的独立服务发现系统架构简单，在 Kubernetes 中选择独立服务发现系统可以帮助增强业务可靠性、可伸缩性、性能及可维护性，对于规模大、增长快、稳定性要求高的业务来说是一个较理想的服务发现方案。希望大家都能找到适合自己业务的服务发现系统。

正己

343

张智超

2025-02-07

468

巧用通义灵码，提升前端研发效率

本次分享，主题是利用通义灵码提升前端研发效率。分享内容主要包括以下几部分：首先，我将从前端开发的角度介绍对通义灵码的基本认识；其次，我将展示通义灵码在日常研发中的应用案例；然后，我将通过实例说明，良好的设计能够显著提升通义灵码的效果。在第四个部分，我将介绍通义灵码的企业知识库以及如何利用 RAG 构建团队智能研发助手。最后，我将总结本次分享并展望未来方向。

张智超

468

荣阳

2025-02-28

1049

使用A10单卡24G复现DeepSeek R1强化学习过程

本文描述DeepSeek的三个模型的学习过程，其中DeepSeek-R1-Zero模型所涉及的强化学习算法，是DeepSeek最核心的部分之一会重点展示。

荣阳

1,049

望雲十雨言澈

2025-04-10

570

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

570

阿里云基础设施.

2025-05-01

388

ACK AI Profiling：从黑箱到透明的问题剖析

本文从一个通用的客户问题出发，描述了一个问题如何从前置排查到使用AI Profiling进行详细的排查，最后到问题定位与解决、业务执行过程的分析，从而展现一个从黑箱到透明的精细化的剖析过程。

阿里云基础设施.

388

官方博客-第23页-阿里云开发者社区

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

表格存储低成本向量检索服务助力 AI 检索

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

云端问道11期实践教学-创建专属AI助手

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

巧用通义灵码，提升前端研发效率

使用A10单卡24G复现DeepSeek R1强化学习过程

AI Infra之模型显存管理分析

ACK AI Profiling：从黑箱到透明的问题剖析

官方博客-第23页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

表格存储低成本向量检索服务助力 AI 检索

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

云端问道11期实践教学-创建专属AI助手

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

巧用通义灵码，提升前端研发效率

使用A10单卡24G复现DeepSeek R1强化学习过程

AI Infra之模型显存管理分析

ACK AI Profiling：从黑箱到透明的问题剖析

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理