【ECS生长万物之开源】使用计算巢服务实现大模型的零代码微调

简介: 【ECS生长万物之开源】使用计算巢服务实现大模型的零代码微调

系列文章

前言

各位看官,最近是否被大模型相关信息刷屏了呢,铺天盖地的大模型预训练、微调等各种关键词是否让你眼花缭乱呢?在如此热度之下,你有没有想过自己亲自动手部署一个大模型执行训练或者微调呢,或许你曾经尝试过却被某个繁琐的步骤劝退了呢?又或者你是模型的研究人员或开发人员,想要让你的模型服务更多用户、有更大的影响力?如果你有自己的基础大模型供给其他人精调,却苦于难以部署、难以让用户上手使用等各种问题,来试试计算巢吧,你的这些问题都将迎刃而解!

按照传统方式,想要对一个大模型进行微调一共需要以下这些步骤:

首先需要创建云资源或者使用线下资源,然后安装各种GPU驱动和各种依赖环境。接着需要自己编写微调脚本或者找一些开源的微调方法,然后就是一系列的pip install或者conda install。运气好的话,你的微调能够顺利run起来,可是稍有差池,也许就会抛出各类错误让你崩溃。讲到这里有没有勾起你痛苦的回忆?没关系,计算巢将为你彻底解决这些烦恼!!!


在前文《计算巢实现大模型微调——如何发布一个微调服务》中我们已经实现了微调服务的发布,接下来将带领大家通过计算巢发布的微调服务实现真正的零代码微调。

创建微调服务实例

服务实例的创建只需要简单几步,下面将逐步展示整个创建流程!

点击创建实例

登陆阿里云计算巢控制台,选择发布的大模型微调服务并点击正式创建进入服务创建页面。

选择资源创建地域和规格

GPU规格大家根据实际需求和库存情况选择。优先推荐使用A10训练速度更快(也可以选择算力更强的规格)。

其他选项

这里根据自己的情况选择可用区和VPC等信息,输入实例密码。值得注意的是系统盘尽量大于100G防止加载模型或数据集时存储空间不够。

确认订单

勾选“我已阅读并同意《计算巢服务协议》”后,点击立即创建即可成功创建属于你的大模型微调服务实例。

等待服务部署完成后点击“详情”按钮即可访问服务页面。

执行微调

在服务详情页面提供了NoteBook登陆地址,可以方便地进行代码的调试等各类操作。

而我们的重点——微调指令,放在了“运维管理”中。

点击运维管理后会看到服务商运维选项,选择“执行微调”并调整参数即可下发微调指令。

接下来点击“下一步”后再点击“创建”即可成功创建一个微调任务并将指令下发到我们的GPU实例上。

稍等片刻后等任务状态变为“成功”时,任务就已经成功在实例后台运行了。

您也可以点击服务商运维“查看训练日志”按钮,通过执行输出查看训练日志情况,操作步骤和执行微调是完全一致的,就不再赘述。

到这里,经过简单的几个步骤ChatGLM的微调任务就已经成功执行了,我们只需要耐心等待微调结束就可以获得属于自己的微调大模型啦!

总结

通过计算巢的大模型微调服务,我们仅需要鼠标十余次的点击即可完成大模型的微调操作,这让大模型微调的技术门槛不再存在,人人都可以拥有自己的微调大模型。还等什么,快来计算巢试用体验吧!

相关文章
|
17天前
|
人工智能 网络安全 开发工具
视觉智能开放平台操作报错合集之服务部署在pdd的服务器,调用报错:The SSL connection could not be established,该如何解决
在使用视觉智能开放平台时,可能会遇到各种错误和问题。虽然具体的错误代码和消息会因平台而异,但以下是一些常见错误类型及其可能的原因和解决策略的概述,包括但不限于:1. 认证错误、2. 请求参数错误、3. 资源超限、4. 图像质量问题、5. 服务不可用、6. 模型不支持的场景、7. 网络连接问题,这有助于快速定位和解决问题。
|
2月前
|
弹性计算 运维 Java
最佳实践:阿里云倚天ECS在千寻位置时空智能服务的规模化应用
阿里云、平头哥及安谋科技联合举办的飞天技术沙龙探讨了倚天Arm架构在业务创新中的应用。活动中,千寻位置运维专家分享了将核心业务迁移到倚天处理器ECS实例的成功案例,强调了倚天处理器的高能效比和降本增效优势。迁移过程涉及操作系统、CICD系统和监控系统的适配,以及业务系统的性能测试。目前,千寻已迁移了上千台ECS实例到倚天处理器,实现了成本和效率的显著提升。未来计划继续扩展倚天处理器在核心业务和K8S中的应用。
|
8天前
|
Shell
服务器需要扩容,如何停止宝塔的所有服务?
服务器需要扩容,如何停止宝塔的所有服务?
17 3
|
10天前
|
存储 应用服务中间件 文件存储
Ngnix服务器版本升级需求分析,如何不停止Ngnix服务进行升级
Ngnix服务器版本升级需求分析,如何不停止Ngnix服务进行升级
|
14天前
|
Prometheus 监控 Cloud Native
Java 服务挂掉,服务器异常宕机问题排查
Java 服务挂掉,服务器异常宕机问题排查
20 1
|
23天前
|
JSON API 数据库
Python使用Quart作为web服务器的代码实现
Quart 是一个异步的 Web 框架,它使用 ASGI 接口(Asynchronous Server Gateway Interface)而不是传统的 WSGI(Web Server Gateway Interface)。这使得 Quart 特别适合用于构建需要处理大量并发连接的高性能 Web 应用程序。与 Flask 类似,Quart 也非常灵活,可以轻松地构建 RESTful API、WebSockets、HTTP/2 服务器推送等。
|
18天前
|
Shell 网络安全 开发工具
git实现服务器自动push拉取代码--webhooks
git实现服务器自动push拉取代码--webhooks
28 1
|
11天前
|
负载均衡 Java Linux
黑马头条01,环境搭建,今日头条的介绍,今日头条的功能架构图,技术栈的说明,服务层,nacos(奶靠丝)安装,安装在Linux服务器上环境准备,
黑马头条01,环境搭建,今日头条的介绍,今日头条的功能架构图,技术栈的说明,服务层,nacos(奶靠丝)安装,安装在Linux服务器上环境准备,
|
1月前
|
机器学习/深度学习 人工智能 网络安全
人工智能平台PAI产品使用合集之在本地可以成功进入模型流,但在服务器上无法进入,是什么原因
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
12天前
|
缓存 Linux 开发工具
centos设置ntp服务同步目标服务器时间
【7 月更文挑战第 1天】linux+centos设置ntp服务同步目标服务器时间

相关产品

  • 计算巢服务