模型微调不再被代码难住!PAI和Qwen3-Coder加速AI开发新体验

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
简介: 通义千问 AI 编程大模型 Qwen3-Coder 正式开源,阿里云人工智能平台 PAI 支持云上一键部署 Qwen3-Coder 模型,并可在交互式建模环境中使用 Qwen3-Coder 模型。

01 相关背景


Qwen3-Coder x PAI-DSW


在阿里云人工智能平台 PAI 交互式建模 PAI-DSW 中使用 Qwen3-Coder,有效解决环境调试慢、训练代码跑不通等难题。


对并发、时延等性能有较高要求的企业客户,可选择 PAI 平台部署的模型服务作为模型源,适合企业级高性能部署;


对个人开发者或测试需要,阿里云7月26日推出免费使用计划,Qwen3-Coder 在通义灵码 AI IDE、VSCode 和 Jetbrains 插件端免费使用,可以使用 DSW x 通义灵码 VSCode,操作方式请参考文末,免费无 Token 限制!


Qwen3-Coder 模型介绍


7月23日,通义千问最新的 AI 编程大模型 Qwen3-Coder 正式开源。全新的 Qwen3-Coder 模型拥有卓越的代码和 Agent 能力。其最强大变体 Qwen3-Coder-480B-A35B-Instruct 是一个 MoE 模型,在编程任务上展现出显著的性能,同时具备长上下文能力。模型需要至少 16*96G 显存的计算资源进行推理,阿里云人工智能平台 PAI 支持云端一键部署。


640.png

PAI-DSW 介绍


交互式建模 PAI-DSW(Data Science Workshop)为您提供云端 AI 开发 IDE 或开发机,内置多种开发环境,熟悉 Notebook/VSCode 的用户,可以快速开始模型开发。此外,DSW 支持丰富的异构计算资源,能够挂载 OSS、NAS、CPFS 类型数据集,预置多种开源框架镜像,并支持实例的生命周期管理,帮助您实现高效的开发模式。


02 具体步骤


Step1:新建 DSW 实例


1. 登录阿里云账号,进入人工智能平台 PAI 工作空间,左侧导航栏选择 “模型开发与训练”-交互式建模(DSW)。


2. 新建 DSW 实例,在环境信息中,选用以下镜像,该镜像内置了符合版本要求的 nodejs。


modelscope:1.28.0-pytorch2.6.0-gpu-py311-cu124-ubuntu22.04


自定义启动脚本中配置:

    export NVM_DIR="$HOME/.nvm"
    [ -s "$NVM_DIR/nvm.sh" ] && \. "$NVM_DIR/nvm.sh"
    nvm use 22
    npm i -g @qwen-code/qwen-code


    环境变量中配置模型调用信息:

    PAI-Model Gallery 完成模型部署。模型部署成功后,从服务详情页中复制调用信息并填写。


    640 (1).png


    Step2:进入 Agentic CLI Qwen Code


    当 PAI-DSW 实例处于运行中,可以打开实例,点击顶部的“Terminal”进入终端,输入 “qwen”,就进入了交互式的 Agentic 命令行工具,可以通过自然语言驱使 Qwen3-coder 深入体验 Vibe Coding。


    640 (2).png


    Step3:让 Qwen3 Coder 写 Notebook 教程


    1. 输入以下 Prompt,让 Qwen3-Coder 直接根据特定几个案例目录,写一份模型微调 Notebook 教程。

      Prompt:
      写一篇基于 Qwen3-coder 基础模型进行 sft 的 notebook 教程,注意: 
      1. 先 check 当前环境中的显存等资源配置情况和环境配置,避免资源受限及重复安装导致的环境冲突问题 
      2. 需要正确可执行,且运行时间不要太长  
      3. 模型获取来源用 ModelScope。


      他会根据要求拆解任务,生成 ipynb 文件并完成代码编写,我们在页面顶部切换到 Notebook,就可以找到刚生成的 ipynb 文件,可以在 Jupyter 中运行调试:


      640 (3).png


      2. 经过几轮关于执行报错的自动修改和优化后,最终 Qwen3-Coder 生成的 Notebook 如下:


      640 (4).png


      整个 Notebook 生成过程,人工输入的信息较少,执行的报错信息就记录在  Notebook 文件中, Debug 过程快捷方便,仅需从 Jupyterlab 切换至 Terminal,让 Qwen Code 读 ipynb 文件分析解决。


      640 (5).png


      更多选择:在 WebIDE 中使用 Qwen3-Coder


      在 Terminal 使用之外,开发者还可通过 DSW WebIDE 深度整合的通义灵码插件,无缝调用 Qwen3-Coder 卓越的代码生成能力。对于习惯于沉浸式开发环境的开发者而言,只需轻点 IDE 界面中的智能代码辅助模块,即可选择 Qwen3-Coder 作为协同创作伙伴。最重要的是,现在这种方式使用不收取任何 Token 费用,欢迎体验!


      640 (6).png


      03 结语


      阿里云人工智能平台 PAI 作为一站式全链路 AI 开发平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的 AI 开发全链路服务。PAI 平台致力于为开发者和企业用户带来了更快、更高效、更便捷的 AI 开发和应用体验。 PAI-Notebook Gallery 提供来自各个行业和技术方向、简单易用、一键启动的 Notebook 教程,预置镜像和代码,高效完成模型开发;PAI-Model Gallery 集成了国内外 AI 开源社区中优质的预训练模型,支持零代码方式实现模型训练和推理。在未来,PAI 平台将持续上线 Notebook 教程和 SOTA 模型最佳实践,期待您的使用!

      相关实践学习
      使用PAI+LLaMA Factory微调Qwen2-VL模型,搭建文旅领域知识问答机器人
      使用PAI和LLaMA Factory框架,基于全参方法微调 Qwen2-VL模型,使其能够进行文旅领域知识问答,同时通过人工测试验证了微调的效果。
      机器学习概览及常见算法
      机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
      相关文章
      |
      8天前
      |
      机器学习/深度学习 数据采集 人工智能
      PyTorch学习实战:AI从数学基础到模型优化全流程精解
      本文系统讲解人工智能、机器学习与深度学习的层级关系,涵盖PyTorch环境配置、张量操作、数据预处理、神经网络基础及模型训练全流程,结合数学原理与代码实践,深入浅出地介绍激活函数、反向传播等核心概念,助力快速入门深度学习。
      39 1
      |
      1月前
      |
      人工智能 自然语言处理 搜索推荐
      AI Compass前沿速览:Qoder Agentic编程、vivo Vision头显、AIRI桌面伴侣、RM-Gallery奖励模型平台
      AI Compass前沿速览:Qoder Agentic编程、vivo Vision头显、AIRI桌面伴侣、RM-Gallery奖励模型平台
      AI Compass前沿速览:Qoder Agentic编程、vivo Vision头显、AIRI桌面伴侣、RM-Gallery奖励模型平台
      |
      27天前
      |
      存储 人工智能 自然语言处理
      告别文字乱码!全新文生图模型Qwen-Image来咯
      通义千问团队开源了Qwen-Image,一个20B参数的MMDiT模型,具备卓越的文本渲染和图像编辑能力。支持复杂中英文文本生成与自动布局,适用于多场景图像生成与编辑任务,已在魔搭社区与Hugging Face开源。
      318 2
      |
      1月前
      |
      机器学习/深度学习 人工智能 监控
      大型动作模型LAM:让企业重复任务实现80%效率提升的AI技术架构与实现方案
      大型动作模型(LAMs)作为人工智能新架构,融合神经网络与符号逻辑,实现企业重复任务的自动化处理。通过神经符号集成、动作执行管道、模式学习、任务分解等核心技术,系统可高效解析用户意图并执行复杂操作,显著提升企业运营效率并降低人工成本。其自适应学习能力与上下文感知机制,使自动化流程更智能、灵活,为企业数字化转型提供坚实支撑。
      135 0
      大型动作模型LAM:让企业重复任务实现80%效率提升的AI技术架构与实现方案
      |
      1月前
      |
      存储 人工智能 算法
      AI测试平台实战:深入解析自动化评分和多模型对比评测
      在AI技术迅猛发展的今天,测试工程师面临着如何高效评估大模型性能的全新挑战。本文将深入探讨AI测试平台中自动化评分与多模型对比评测的关键技术与实践方法,为测试工程师提供可落地的解决方案。
      |
      4天前
      |
      机器学习/深度学习 算法 数据可视化
      从零开始训练推理模型:GRPO+Unsloth改造Qwen实战指南
      推理型大语言模型兴起,通过先思考再作答提升性能。本文介绍GRPO等强化学习算法,详解其原理并动手用Qwen2.5-3B训练推理模型,展示训练前后效果对比,揭示思维链生成的实现路径。
      67 1
      从零开始训练推理模型:GRPO+Unsloth改造Qwen实战指南
      |
      17天前
      |
      人工智能 监控 Kubernetes
      稳定支撑大规模模型调用,携程旅游的 AI 网关实践
      为了进一步提升服务水平和服务质量,携程很早就开始在人工智能大模型领域进行探索。而随着工作的深入,大模型服务的应用领域不断扩大,公司内部需要访问大模型服务的应用也越来越多,不可避免的就遇到了几个问题,我们自然就会想到使用网关来对这些服务接入进行统一管理,并增加各种切面上的流量治理功能。
      101 33
      |
      22天前
      |
      机器学习/深度学习 人工智能 JSON
      微软rStar2-Agent:新的GRPO-RoC算法让14B模型在复杂推理时超越了前沿大模型
      Microsoft Research最新推出的rStar2-Agent在AIME24数学基准测试中以80.6%的准确率超越超大规模模型DeepSeek-R1,展现“思考更聪明”而非“更长”的AI推理新方向。
      94 8
      微软rStar2-Agent:新的GRPO-RoC算法让14B模型在复杂推理时超越了前沿大模型
      |
      3天前
      |
      机器学习/深度学习 人工智能 自然语言处理
      如何让AI更“聪明”?VLM模型的优化策略与测试方法全解析​
      本文系统解析视觉语言模型(VLM)的核心机制、推理优化、评测方法与挑战。涵盖多模态对齐、KV Cache优化、性能测试及主流基准,助你全面掌握VLM技术前沿。建议点赞收藏,深入学习。
      73 8

      相关产品

    • 人工智能平台 PAI