【ECS生长万物之开源】使用计算巢服务实现大模型的零代码微调

简介: 【ECS生长万物之开源】使用计算巢服务实现大模型的零代码微调

系列文章

前言

各位看官,最近是否被大模型相关信息刷屏了呢,铺天盖地的大模型预训练、微调等各种关键词是否让你眼花缭乱呢?在如此热度之下,你有没有想过自己亲自动手部署一个大模型执行训练或者微调呢,或许你曾经尝试过却被某个繁琐的步骤劝退了呢?又或者你是模型的研究人员或开发人员,想要让你的模型服务更多用户、有更大的影响力?如果你有自己的基础大模型供给其他人精调,却苦于难以部署、难以让用户上手使用等各种问题,来试试计算巢吧,你的这些问题都将迎刃而解!

按照传统方式,想要对一个大模型进行微调一共需要以下这些步骤:

首先需要创建云资源或者使用线下资源,然后安装各种GPU驱动和各种依赖环境。接着需要自己编写微调脚本或者找一些开源的微调方法,然后就是一系列的pip install或者conda install。运气好的话,你的微调能够顺利run起来,可是稍有差池,也许就会抛出各类错误让你崩溃。讲到这里有没有勾起你痛苦的回忆?没关系,计算巢将为你彻底解决这些烦恼!!!


在前文《计算巢实现大模型微调——如何发布一个微调服务》中我们已经实现了微调服务的发布,接下来将带领大家通过计算巢发布的微调服务实现真正的零代码微调。

创建微调服务实例

服务实例的创建只需要简单几步,下面将逐步展示整个创建流程!

点击创建实例

登陆阿里云计算巢控制台,选择发布的大模型微调服务并点击正式创建进入服务创建页面。

选择资源创建地域和规格

GPU规格大家根据实际需求和库存情况选择。优先推荐使用A10训练速度更快(也可以选择算力更强的规格)。

其他选项

这里根据自己的情况选择可用区和VPC等信息,输入实例密码。值得注意的是系统盘尽量大于100G防止加载模型或数据集时存储空间不够。

确认订单

勾选“我已阅读并同意《计算巢服务协议》”后,点击立即创建即可成功创建属于你的大模型微调服务实例。

等待服务部署完成后点击“详情”按钮即可访问服务页面。

执行微调

在服务详情页面提供了NoteBook登陆地址,可以方便地进行代码的调试等各类操作。

而我们的重点——微调指令,放在了“运维管理”中。

点击运维管理后会看到服务商运维选项,选择“执行微调”并调整参数即可下发微调指令。

接下来点击“下一步”后再点击“创建”即可成功创建一个微调任务并将指令下发到我们的GPU实例上。

稍等片刻后等任务状态变为“成功”时,任务就已经成功在实例后台运行了。

您也可以点击服务商运维“查看训练日志”按钮,通过执行输出查看训练日志情况,操作步骤和执行微调是完全一致的,就不再赘述。

到这里,经过简单的几个步骤ChatGLM的微调任务就已经成功执行了,我们只需要耐心等待微调结束就可以获得属于自己的微调大模型啦!

总结

通过计算巢的大模型微调服务,我们仅需要鼠标十余次的点击即可完成大模型的微调操作,这让大模型微调的技术门槛不再存在,人人都可以拥有自己的微调大模型。还等什么,快来计算巢试用体验吧!

相关文章
|
4天前
|
分布式计算 测试技术 Spark
科大讯飞开源星火化学大模型、文生音效模型
近期,科大讯飞在魔搭社区(ModelScope)和Gitcode上开源两款模型:讯飞星火化学大模型Spark Chemistry-X1-13B、讯飞文生音频模型AudioFly,助力前沿化学技术研究,以及声音生成技术和应用的探索。
50 1
|
2月前
|
人工智能 算法 开发者
开源VLM“华山论剑”丨AI Insight Talk多模态专场直播预告
开源VLM“华山论剑”丨AI Insight Talk多模态专场直播预告
213 10
开源VLM“华山论剑”丨AI Insight Talk多模态专场直播预告
|
22天前
|
机器学习/深度学习 数据采集 人工智能
通义实验室Mobile-Agent-v3开源,全平台SOTA的GUI智能体,支持手机电脑等多平台交互
近日,通义实验室MobileAgent团队正式开源全新图形界面交互基础模型 GUI-Owl,并同步推出支持多智能体协同的自动化框架 Mobile-Agent-v3。该模型基于Qwen2.5-VL打造,在手机端与电脑端共8个GUI任务榜单中全面刷新开源模型性能纪录,达成全平台SOTA。
232 2
|
15天前
|
机器学习/深度学习 人工智能 前端开发
通义DeepResearch全面开源!同步分享可落地的高阶Agent构建方法论
通义研究团队开源发布通义 DeepResearch —— 首个在性能上可与 OpenAI DeepResearch 相媲美、并在多项权威基准测试中取得领先表现的全开源 Web Agent。
1371 87
|
2月前
|
数据采集 机器学习/深度学习 编解码
小红书 hi lab开源最强多模态大模型dots.vlm1,性能对标闭源 Gemini 2.5 Pro 和 Seed-VL1.5
小红书 hi lab开源最强多模态大模型dots.vlm1,性能对标闭源 Gemini 2.5 Pro 和 Seed-VL1.5
320 0
小红书 hi lab开源最强多模态大模型dots.vlm1,性能对标闭源 Gemini 2.5 Pro 和 Seed-VL1.5
|
2月前
智谱发布GLM-4.5V,全球开源多模态推理新标杆,Day0推理微调实战教程到!
视觉语言大模型(VLM)已经成为智能系统的关键基石。随着真实世界的智能任务越来越复杂,VLM模型也亟需在基本的多模态感知之外,逐渐增强复杂任务中的推理能力,提升自身的准确性、全面性和智能化程度,使得复杂问题解决、长上下文理解、多模态智能体等智能任务成为可能。
390 0
|
2月前
|
编解码 算法 测试技术
MiniCPM-V4.0开源,多模态能力进化,手机可用,还有最全CookBook!
今天,面壁小钢炮新一代多模态模型 MiniCPM-V 4.0 正式开源。依靠 4B 参数,取得 在 OpenCompass、OCRBench、MathVista 等多个榜单上取得了同级 SOTA 成绩,且 实现了在手机上稳定、丝滑运行。此外,官方也正式开源了 推理部署工具 MiniCPM-V CookBook,帮助开发者面向不同需求、不同场景、不同设备,均可实现开箱即用的轻量、简易部署。
312 0
|
14天前
|
人工智能 自然语言处理 测试技术
有没有可能不微调也能让大模型准确完成指定任务?(少样本学习)
对于我这种正在从0到1构建AI产品的一人公司来说,Few Shots学习的最大价值在于:用最少的资源获得最大的效果。我不需要大量的标注数据,不需要复杂的模型训练,只需要精心设计几个示例,就能让大模型快速理解我的业务场景。
140 43
|
16天前
|
人工智能 Java 开发者
阿里出手!Java 开发者狂喜!开源 AI Agent 框架 JManus 来了,初次见面就心动~
JManus是阿里开源的Java版OpenManus,基于Spring AI Alibaba框架,助力Java开发者便捷应用AI技术。支持多Agent框架、网页配置、MCP协议及PLAN-ACT模式,可集成多模型,适配阿里云百炼平台与本地ollama。提供Docker与源码部署方式,具备无限上下文处理能力,适用于复杂AI场景。当前仍在完善模型配置等功能,欢迎参与开源共建。
553 58
阿里出手!Java 开发者狂喜!开源 AI Agent 框架 JManus 来了,初次见面就心动~
|
2月前
|
编解码 自然语言处理
通义万相开源14B数字人Wan2.2-S2V!影视级音频驱动视频生成,助力专业内容创作
今天,通义万相的视频生成模型又开源了!本次开源Wan2.2-S2V-14B,是一款音频驱动的视频生成模型,可生成影视级质感的高质量视频。
445 29

相关产品

  • 计算巢服务