官方博客-第21页-阿里云开发者社区

ModelScope

2024-05-15

1143

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,143

寻剑

2024-09-11

341

表格存储低成本向量检索服务助力 AI 检索

本文阐述了阿里云表格存储（Tablestore）如何通过其向量检索服务应对大规模数据检索的需求，尤其是在成本、规模和召回率这三个关键挑战方面。

寻剑

341

明巍临城水德

2024-11-14

542

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

在本文中，作者介绍了 Lingma SWE-GPT，一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

明巍临城水德等

542

李德

2024-12-06

1350

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

本文章基于业务实践，总结有关客服质检场景的解决方案和处理经验，为相似场景提供可行的借鉴方法。

李德

1,350

探索云世界

2025-01-02

400

云端问道11期实践教学-创建专属AI助手

本次分享意在帮助用户更加全面、深入地了解百炼的核心产品能力，并通过实际操作学会如何快速将大模型与自己的系统及应用相结合。主要包括以下三个方面： 1. 阿里云百炼产品定位和能力简介 2. 知识检索 RAG 智能体应用能力和优势 3. 最佳落地案例实践分享

探索云世界

400

殳玄

2025-01-16

1031

现身说法，AI小白的大模型学习路径

写这篇文章的初衷：作为一个AI小白，把我自己学习大模型的学习路径还原出来，包括理解的逻辑、看到的比较好的学习材料，通过一篇文章给串起来，对大模型建立起一个相对体系化的认知，才能够在扑面而来的大模型时代，看出点门道。

殳玄

1,031

张智超

2025-02-07

468

巧用通义灵码，提升前端研发效率

本次分享，主题是利用通义灵码提升前端研发效率。分享内容主要包括以下几部分：首先，我将从前端开发的角度介绍对通义灵码的基本认识；其次，我将展示通义灵码在日常研发中的应用案例；然后，我将通过实例说明，良好的设计能够显著提升通义灵码的效果。在第四个部分，我将介绍通义灵码的企业知识库以及如何利用 RAG 构建团队智能研发助手。最后，我将总结本次分享并展望未来方向。

张智超

468

荣阳

2025-02-28

1049

使用A10单卡24G复现DeepSeek R1强化学习过程

本文描述DeepSeek的三个模型的学习过程，其中DeepSeek-R1-Zero模型所涉及的强化学习算法，是DeepSeek最核心的部分之一会重点展示。

荣阳

1,049

阿里云云原生

2025-05-16

659

日志采集 Agent 性能大比拼——LoongCollector 性能深度测评

为了展现 LoongCollector 的卓越性能，本文通过纵向（LoongCollector 与 iLogtail 产品升级对比）和横向（LoongCollector 与其他开源日志采集 Agent 对比）两方面对比，深度测评不同采集 Agent 在常见的日志采集场景下的性能。

阿里云云原生

659

官方博客-第21页-阿里云开发者社区

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

表格存储低成本向量检索服务助力 AI 检索

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

云端问道11期实践教学-创建专属AI助手

现身说法，AI小白的大模型学习路径

巧用通义灵码，提升前端研发效率

使用A10单卡24G复现DeepSeek R1强化学习过程

日志采集 Agent 性能大比拼——LoongCollector 性能深度测评

官方博客-第21页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

表格存储低成本向量检索服务助力 AI 检索

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

云端问道11期实践教学-创建专属AI助手

现身说法，AI小白的大模型学习路径

巧用通义灵码，提升前端研发效率

使用A10单卡24G复现DeepSeek R1强化学习过程

日志采集 Agent 性能大比拼——LoongCollector 性能深度测评

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理