模型微调不再被代码难住!PAI和Qwen3-Coder加速AI开发新体验

本文涉及的产品
模型训练 PAI-DLC,100CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,每月250计算时 3个月
简介: 通义千问 AI 编程大模型 Qwen3-Coder 正式开源,阿里云人工智能平台 PAI 支持云上一键部署 Qwen3-Coder 模型,并可在交互式建模环境中使用 Qwen3-Coder 模型。

01 相关背景


Qwen3-Coder x PAI-DSW


在阿里云人工智能平台 PAI 交互式建模 PAI-DSW 中使用 Qwen3-Coder,有效解决环境调试慢、训练代码跑不通等难题。


对并发、时延等性能有较高要求的企业客户,可选择 PAI 平台部署的模型服务作为模型源,适合企业级高性能部署;


对个人开发者或测试需要,阿里云7月26日推出免费使用计划,Qwen3-Coder 在通义灵码 AI IDE、VSCode 和 Jetbrains 插件端免费使用,可以使用 DSW x 通义灵码 VSCode,操作方式请参考文末,免费无 Token 限制!


Qwen3-Coder 模型介绍


7月23日,通义千问最新的 AI 编程大模型 Qwen3-Coder 正式开源。全新的 Qwen3-Coder 模型拥有卓越的代码和 Agent 能力。其最强大变体 Qwen3-Coder-480B-A35B-Instruct 是一个 MoE 模型,在编程任务上展现出显著的性能,同时具备长上下文能力。模型需要至少 16*96G 显存的计算资源进行推理,阿里云人工智能平台 PAI 支持云端一键部署。


640.png

PAI-DSW 介绍


交互式建模 PAI-DSW(Data Science Workshop)为您提供云端 AI 开发 IDE 或开发机,内置多种开发环境,熟悉 Notebook/VSCode 的用户,可以快速开始模型开发。此外,DSW 支持丰富的异构计算资源,能够挂载 OSS、NAS、CPFS 类型数据集,预置多种开源框架镜像,并支持实例的生命周期管理,帮助您实现高效的开发模式。


02 具体步骤


Step1:新建 DSW 实例


1. 登录阿里云账号,进入人工智能平台 PAI 工作空间,左侧导航栏选择 “模型开发与训练”-交互式建模(DSW)。


2. 新建 DSW 实例,在环境信息中,选用以下镜像,该镜像内置了符合版本要求的 nodejs。


modelscope:1.28.0-pytorch2.6.0-gpu-py311-cu124-ubuntu22.04


自定义启动脚本中配置:

    export NVM_DIR="$HOME/.nvm"
    [ -s "$NVM_DIR/nvm.sh" ] && \. "$NVM_DIR/nvm.sh"
    nvm use 22
    npm i -g @qwen-code/qwen-code


    环境变量中配置模型调用信息:

    PAI-Model Gallery 完成模型部署。模型部署成功后,从服务详情页中复制调用信息并填写。


    640 (1).png


    Step2:进入 Agentic CLI Qwen Code


    当 PAI-DSW 实例处于运行中,可以打开实例,点击顶部的“Terminal”进入终端,输入 “qwen”,就进入了交互式的 Agentic 命令行工具,可以通过自然语言驱使 Qwen3-coder 深入体验 Vibe Coding。


    640 (2).png


    Step3:让 Qwen3 Coder 写 Notebook 教程


    1. 输入以下 Prompt,让 Qwen3-Coder 直接根据特定几个案例目录,写一份模型微调 Notebook 教程。

      Prompt:
      写一篇基于 Qwen3-coder 基础模型进行 sft 的 notebook 教程,注意: 
      1. 先 check 当前环境中的显存等资源配置情况和环境配置,避免资源受限及重复安装导致的环境冲突问题 
      2. 需要正确可执行,且运行时间不要太长  
      3. 模型获取来源用 ModelScope。


      他会根据要求拆解任务,生成 ipynb 文件并完成代码编写,我们在页面顶部切换到 Notebook,就可以找到刚生成的 ipynb 文件,可以在 Jupyter 中运行调试:


      640 (3).png


      2. 经过几轮关于执行报错的自动修改和优化后,最终 Qwen3-Coder 生成的 Notebook 如下:


      640 (4).png


      整个 Notebook 生成过程,人工输入的信息较少,执行的报错信息就记录在  Notebook 文件中, Debug 过程快捷方便,仅需从 Jupyterlab 切换至 Terminal,让 Qwen Code 读 ipynb 文件分析解决。


      640 (5).png


      更多选择:在 WebIDE 中使用 Qwen3-Coder


      在 Terminal 使用之外,开发者还可通过 DSW WebIDE 深度整合的通义灵码插件,无缝调用 Qwen3-Coder 卓越的代码生成能力。对于习惯于沉浸式开发环境的开发者而言,只需轻点 IDE 界面中的智能代码辅助模块,即可选择 Qwen3-Coder 作为协同创作伙伴。最重要的是,现在这种方式使用不收取任何 Token 费用,欢迎体验!


      640 (6).png


      03 结语


      阿里云人工智能平台 PAI 作为一站式全链路 AI 开发平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的 AI 开发全链路服务。PAI 平台致力于为开发者和企业用户带来了更快、更高效、更便捷的 AI 开发和应用体验。 PAI-Notebook Gallery 提供来自各个行业和技术方向、简单易用、一键启动的 Notebook 教程,预置镜像和代码,高效完成模型开发;PAI-Model Gallery 集成了国内外 AI 开源社区中优质的预训练模型,支持零代码方式实现模型训练和推理。在未来,PAI 平台将持续上线 Notebook 教程和 SOTA 模型最佳实践,期待您的使用!

      相关实践学习
      使用PAI+LLaMA Factory微调Qwen2-VL模型,搭建文旅领域知识问答机器人
      使用PAI和LLaMA Factory框架,基于全参方法微调 Qwen2-VL模型,使其能够进行文旅领域知识问答,同时通过人工测试验证了微调的效果。
      机器学习概览及常见算法
      机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
      相关文章
      |
      1月前
      |
      云安全 人工智能 自然语言处理
      阿里云x硅基流动:AI安全护栏助力构建可信模型生态
      阿里云AI安全护栏:大模型的“智能过滤系统”。
      |
      1月前
      |
      人工智能 IDE Java
      AI Coding实践:CodeFuse + prompt 从系分到代码
      在蚂蚁国际信贷业务系统建设过程中,技术团队始终面临双重考验:一方面需应对日益加速的需求迭代周期,满足严苛的代码质量规范与金融安全合规要求;另一方面,跨地域研发团队的协同效率与代码标准统一性,在传统开发模式下逐渐显现瓶颈。为突破效率制约、提升交付质量,我们积极探索人工智能辅助代码生成技术(AI Coding)的应用实践。本文基于蚂蚁国际信贷技术团队近期的实际项目经验,梳理AI辅助开发在金融级系统快速迭代场景中的实施要点并分享阶段性实践心得。
      374 25
      AI Coding实践:CodeFuse + prompt 从系分到代码
      |
      1月前
      |
      人工智能 自然语言处理 安全
      氛围编程陷阱:为什么AI生成代码正在制造大量"伪开发者"
      AI兴起催生“氛围编程”——用自然语言生成代码,看似高效实则陷阱。它让人跳过编程基本功,沦为只会提示、不懂原理的“中间商”。真实案例显示,此类项目易崩溃、难维护,安全漏洞频出。AI是技能倍增器,非替代品;真正强大的开发者,永远是那些基础扎实、能独立解决问题的人。
      197 11
      氛围编程陷阱:为什么AI生成代码正在制造大量"伪开发者"
      |
      1月前
      |
      人工智能 机器人 测试技术
      AI写的代码为何金玉其外败絮其中
      本文分析AI编码看着好看其实很烂的现象、原因,探索行之有效的的解决方案。并从理论上延伸到如何更好的与AI协作的方式上。
      75 3
      |
      2月前
      |
      人工智能 Java API
      AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
      本文介绍AI大模型的核心概念、分类及开发者学习路径,重点讲解如何选择与接入大模型。项目基于Spring Boot,使用阿里云灵积模型(Qwen-Plus),对比SDK、HTTP、Spring AI和LangChain4j四种接入方式,助力开发者高效构建AI应用。
      1408 122
      AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
      |
      1月前
      |
      人工智能 搜索推荐 程序员
      当AI学会“跨界思考”:多模态模型如何重塑人工智能
      当AI学会“跨界思考”:多模态模型如何重塑人工智能
      261 120
      |
      1月前
      |
      人工智能 监控 Java
      零代码改造 + 全链路追踪!Spring AI 最新可观测性详细解读
      Spring AI Alibaba 通过集成 OpenTelemetry 实现可观测性,支持框架原生和无侵入探针两种方式。原生方案依赖 Micrometer 自动埋点,适用于快速接入;无侵入探针基于 LoongSuite 商业版,无需修改代码即可采集标准 OTLP 数据,解决了原生方案扩展性差、调用链易断链等问题。未来将开源无侵入探针方案,整合至 AgentScope Studio,并进一步增强多 Agent 场景下的观测能力。
      1394 33
      |
      1月前
      |
      人工智能 安全 开发工具
      C3仓库AI代码门禁通用实践:基于Qwen3-Coder+RAG的代码评审
      本文介绍基于Qwen3-Coder、RAG与Iflow在C3级代码仓库落地LLM代码评审的实践,实现AI辅助人工评审。通过CI流水线自动触发,结合私域知识库与生产代码同仓管理,已成功拦截数十次高危缺陷,显著提升评审效率与质量,具备向各类代码门禁平台复用推广的价值。(239字)
      385 24

      热门文章

      最新文章

      相关产品

    • 人工智能平台 PAI