模型微调不再被代码难住!PAI和Qwen3-Coder加速AI开发新体验

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
交互式建模 PAI-DSW,每月250计算时 3个月
简介: 通义千问 AI 编程大模型 Qwen3-Coder 正式开源,阿里云人工智能平台 PAI 支持云上一键部署 Qwen3-Coder 模型,并可在交互式建模环境中使用 Qwen3-Coder 模型。

01 相关背景


Qwen3-Coder x PAI-DSW


在阿里云人工智能平台 PAI 交互式建模 PAI-DSW 中使用 Qwen3-Coder,有效解决环境调试慢、训练代码跑不通等难题。


对并发、时延等性能有较高要求的企业客户,可选择 PAI 平台部署的模型服务作为模型源,适合企业级高性能部署;


对个人开发者或测试需要,阿里云7月26日推出免费使用计划,Qwen3-Coder 在通义灵码 AI IDE、VSCode 和 Jetbrains 插件端免费使用,可以使用 DSW x 通义灵码 VSCode,操作方式请参考文末,免费无 Token 限制!


Qwen3-Coder 模型介绍


7月23日,通义千问最新的 AI 编程大模型 Qwen3-Coder 正式开源。全新的 Qwen3-Coder 模型拥有卓越的代码和 Agent 能力。其最强大变体 Qwen3-Coder-480B-A35B-Instruct 是一个 MoE 模型,在编程任务上展现出显著的性能,同时具备长上下文能力。模型需要至少 16*96G 显存的计算资源进行推理,阿里云人工智能平台 PAI 支持云端一键部署。


640.png

PAI-DSW 介绍


交互式建模 PAI-DSW(Data Science Workshop)为您提供云端 AI 开发 IDE 或开发机,内置多种开发环境,熟悉 Notebook/VSCode 的用户,可以快速开始模型开发。此外,DSW 支持丰富的异构计算资源,能够挂载 OSS、NAS、CPFS 类型数据集,预置多种开源框架镜像,并支持实例的生命周期管理,帮助您实现高效的开发模式。


02 具体步骤


Step1:新建 DSW 实例


1. 登录阿里云账号,进入人工智能平台 PAI 工作空间,左侧导航栏选择 “模型开发与训练”-交互式建模(DSW)。


2. 新建 DSW 实例,在环境信息中,选用以下镜像,该镜像内置了符合版本要求的 nodejs。


modelscope:1.28.0-pytorch2.6.0-gpu-py311-cu124-ubuntu22.04


自定义启动脚本中配置:

    export NVM_DIR="$HOME/.nvm"
    [ -s "$NVM_DIR/nvm.sh" ] && \. "$NVM_DIR/nvm.sh"
    nvm use 22
    npm i -g @qwen-code/qwen-code


    环境变量中配置模型调用信息:

    PAI-Model Gallery 完成模型部署。模型部署成功后,从服务详情页中复制调用信息并填写。


    640 (1).png


    Step2:进入 Agentic CLI Qwen Code


    当 PAI-DSW 实例处于运行中,可以打开实例,点击顶部的“Terminal”进入终端,输入 “qwen”,就进入了交互式的 Agentic 命令行工具,可以通过自然语言驱使 Qwen3-coder 深入体验 Vibe Coding。


    640 (2).png


    Step3:让 Qwen3 Coder 写 Notebook 教程


    1. 输入以下 Prompt,让 Qwen3-Coder 直接根据特定几个案例目录,写一份模型微调 Notebook 教程。

      Prompt:
      写一篇基于 Qwen3-coder 基础模型进行 sft 的 notebook 教程,注意: 
      1. 先 check 当前环境中的显存等资源配置情况和环境配置,避免资源受限及重复安装导致的环境冲突问题 
      2. 需要正确可执行,且运行时间不要太长  
      3. 模型获取来源用 ModelScope。


      他会根据要求拆解任务,生成 ipynb 文件并完成代码编写,我们在页面顶部切换到 Notebook,就可以找到刚生成的 ipynb 文件,可以在 Jupyter 中运行调试:


      640 (3).png


      2. 经过几轮关于执行报错的自动修改和优化后,最终 Qwen3-Coder 生成的 Notebook 如下:


      640 (4).png


      整个 Notebook 生成过程,人工输入的信息较少,执行的报错信息就记录在  Notebook 文件中, Debug 过程快捷方便,仅需从 Jupyterlab 切换至 Terminal,让 Qwen Code 读 ipynb 文件分析解决。


      640 (5).png


      更多选择:在 WebIDE 中使用 Qwen3-Coder


      在 Terminal 使用之外,开发者还可通过 DSW WebIDE 深度整合的通义灵码插件,无缝调用 Qwen3-Coder 卓越的代码生成能力。对于习惯于沉浸式开发环境的开发者而言,只需轻点 IDE 界面中的智能代码辅助模块,即可选择 Qwen3-Coder 作为协同创作伙伴。最重要的是,现在这种方式使用不收取任何 Token 费用,欢迎体验!


      640 (6).png


      03 结语


      阿里云人工智能平台 PAI 作为一站式全链路 AI 开发平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的 AI 开发全链路服务。PAI 平台致力于为开发者和企业用户带来了更快、更高效、更便捷的 AI 开发和应用体验。 PAI-Notebook Gallery 提供来自各个行业和技术方向、简单易用、一键启动的 Notebook 教程,预置镜像和代码,高效完成模型开发;PAI-Model Gallery 集成了国内外 AI 开源社区中优质的预训练模型,支持零代码方式实现模型训练和推理。在未来,PAI 平台将持续上线 Notebook 教程和 SOTA 模型最佳实践,期待您的使用!

      相关实践学习
      使用PAI+LLaMA Factory微调Qwen2-VL模型,搭建文旅领域知识问答机器人
      使用PAI和LLaMA Factory框架,基于全参方法微调 Qwen2-VL模型,使其能够进行文旅领域知识问答,同时通过人工测试验证了微调的效果。
      机器学习概览及常见算法
      机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
      相关文章
      |
      19天前
      |
      人工智能 测试技术 开发工具
      如何将 AI 代码采纳率从30%提升到80%?
      AI编码采纳率低的根本原因在于人类期望其独立完成模糊需求,本文提出了解决之道,讲解如何通过结构化文档和任务拆解提高AI的基础可靠性。
      357 23
      |
      16天前
      |
      分布式计算 测试技术 Spark
      科大讯飞开源星火化学大模型、文生音效模型
      近期,科大讯飞在魔搭社区(ModelScope)和Gitcode上开源两款模型:讯飞星火化学大模型Spark Chemistry-X1-13B、讯飞文生音频模型AudioFly,助力前沿化学技术研究,以及声音生成技术和应用的探索。
      114 2
      |
      16天前
      |
      人工智能 Java API
      AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
      本文介绍AI大模型的核心概念、分类及开发者学习路径,重点讲解如何选择与接入大模型。项目基于Spring Boot,使用阿里云灵积模型(Qwen-Plus),对比SDK、HTTP、Spring AI和LangChain4j四种接入方式,助力开发者高效构建AI应用。
      614 122
      AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
      |
      18天前
      |
      机器学习/深度学习 人工智能 自然语言处理
      AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
      AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
      231 13
      AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
      |
      15天前
      |
      自然语言处理 机器人 图形学
      腾讯混元图像3.0正式开源发布!80B,首个工业级原生多模态生图模型
      腾讯混元图像3.0,真的来了——开源,免费开放使用。 正式介绍一下:混元图像3.0(HunyuanImage 3.0),是首个工业级原生多模态生图模型,参数规模80B,也是目前测评效果最好、参数量最大的开源生图模型,效果可对…
      324 2
      腾讯混元图像3.0正式开源发布!80B,首个工业级原生多模态生图模型
      |
      19天前
      |
      人工智能 负载均衡 API
      Vercel 发布 AI Gateway 神器!可一键访问数百个模型,助力零门槛开发 AI 应用
      大家好,我是Immerse,独立开发者、AGI实践者。分享编程、AI干货、开源项目与个人思考。关注公众号“沉浸式趣谈”,获取独家内容。Vercel新推出的AI Gateway,统一多模型API,支持自动切换、负载均衡与零加价调用,让AI开发更高效稳定。一行代码切换模型,告别接口烦恼!
      187 1
      Vercel 发布 AI Gateway 神器!可一键访问数百个模型,助力零门槛开发 AI 应用
      |
      5天前
      |
      人工智能 监控 Java
      零代码改造 + 全链路追踪!Spring AI 最新可观测性详细解读
      Spring AI Alibaba 通过集成 OpenTelemetry 实现可观测性,支持框架原生和无侵入探针两种方式。原生方案依赖 Micrometer 自动埋点,适用于快速接入;无侵入探针基于 LoongSuite 商业版,无需修改代码即可采集标准 OTLP 数据,解决了原生方案扩展性差、调用链易断链等问题。未来将开源无侵入探针方案,整合至 AgentScope Studio,并进一步增强多 Agent 场景下的观测能力。
      |
      17天前
      |
      设计模式 人工智能 API
      AI智能体开发实战:17种核心架构模式详解与Python代码实现
      本文系统解析17种智能体架构设计模式,涵盖多智能体协作、思维树、反思优化与工具调用等核心范式,结合LangChain与LangGraph实现代码工作流,并通过真实案例验证效果,助力构建高效AI系统。
      223 7
      |
      18天前
      |
      机器学习/深度学习 人工智能 数据安全/隐私保护
      阿里云 Qwen3 全栈 AI 模型:技术解析、开发者实操指南与 100 万企业落地案例
      阿里云发布Qwen3全栈AI体系,推出Qwen3-Max、Qwen3-Next等七大模型,性能全球领先,开源生态超6亿次下载。支持百万级上下文、多模态理解,训练成本降90%,助力企业高效落地AI。覆盖制造、金融、创作等场景,提供无代码与代码级开发工具,共建超级AI云生态。
      312 6

      热门文章

      最新文章

      相关产品

    • 人工智能平台 PAI