官方博客-第14页-阿里云开发者社区

ModelScope

2024-05-15

1135

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,135

明巍临城水德

2024-11-14

537

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

在本文中，作者介绍了 Lingma SWE-GPT，一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

明巍临城水德等

537

殳玄

2025-01-16

1026

现身说法，AI小白的大模型学习路径

写这篇文章的初衷：作为一个AI小白，把我自己学习大模型的学习路径还原出来，包括理解的逻辑、看到的比较好的学习材料，通过一篇文章给串起来，对大模型建立起一个相对体系化的认知，才能够在扑面而来的大模型时代，看出点门道。

殳玄

1,026

以珩

2025-04-10

510

用自定义插件生成一篇图文并茂的文章

本文是《5步教你创建大模型自定义插件》的下篇，主要就已有的自定义插件中的生图能力为例，演示如何生成一个图文并茂的文章。

以珩

510

阿里云云原生

2025-08-26

505

云速搭 AI 助理发布：对话式生成可部署的阿里云架构图

阿里云云速搭 CADT（Cloud Architect Design Tools）推出智能化升级——云小搭，一款基于大模型的 AI 云架构助手，致力于让每一位用户都能“动动嘴”就完成专业级云架构设计。

阿里云云原生

505

资源编排ROS

2023-12-01

690

本文介绍了如何使用阿里云ROS资源编排服务快速部署和管理云资源。主要内容包括：1. 工具准备：安装ROSCDK,选择合适的代码编辑器和IDE,安装AI代码生成插件等。2. 环境准备：创建工程目录，进入虚拟环境，配置阿里云凭证信息，配置ROSCDK。3. 代码编写：根据文档描述，编写ROS代码来创建VPC、VSwitch、ECS等资源。4. 运行代码：执行ROS代码，创建ECS实例并部署FTP服务。总体来说，本文通过简单的步骤，让小白也能快速上手使用ROS资源编排服务，实现自动化部署和管理阿里云资源。

资源编排ROS

690

雅纯

2024-05-15

103634

一文搞懂需求流程规范的制定方法和落地技巧

随着业务和产品的发展、团队的不断扩大，很多团队都不可避免的会遇到需求流程混乱的问题。虽然有的团队也编写了一些“需求流程规范”的文档，但最终却流于纸面，难以在团队真正落地。如何科学制定并有效落实需求管理规范呢？对此，云效产品经理陈逊进行了非常详细的直播分享，本文是他经验的文字总结。

雅纯

103,634

景祁

2024-05-15

164508

设计与构建 FinOps 流程、团队、体系与目标

企业 FinOps 实施不是一蹴而就的项目，如果您正在推进企业云原生 FinOps 落地，除了选择合适的技术手段，企业内部的流程和体系建设也尤为重要。

景祁

164,508

ModelScope

2024-05-15

742

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

742

官方博客-第14页-阿里云开发者社区

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

现身说法，AI小白的大模型学习路径

用自定义插件生成一篇图文并茂的文章

云速搭 AI 助理发布：对话式生成可部署的阿里云架构图

从零开始使用 ROS CDK 搭建云上解决方案

一文搞懂需求流程规范的制定方法和落地技巧

设计与构建 FinOps 流程、团队、体系与目标

联合XTuner，魔搭社区全面支持数据集的长文本训练

官方博客-第14页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

现身说法，AI小白的大模型学习路径

用自定义插件生成一篇图文并茂的文章

云速搭 AI 助理发布：对话式生成可部署的阿里云架构图

从零开始使用 ROS CDK 搭建云上解决方案

一文搞懂需求流程规范的制定方法和落地技巧

设计与构建 FinOps 流程、团队、体系与目标

联合XTuner，魔搭社区全面支持数据集的长文本训练

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理