文档备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

小白求助，跟着大模型微调教程做不太明白

教程：https://www.modelscope.cn/learn/673
标题：15分钟掌握大模型自我认知微调，定制个人专属大模型

1.已启动notebook的GPU环境

2.创建了.ipynb文件

3.设置了镜像并安装了ms-swift

代码如下
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/
pip install 'ms-swift[llm]' -U
（小问题：这里两行代码必须分两个代码框，放在一个里面就会出错，不知道为什么）

4.已完成微调前推理

代码如下
import os
os.environ['CUDA_VISIBLE_DEVICES'] = '0'

from swift.llm import ModelType, InferArguments, infer_main
infer_args = InferArguments(model_type=ModelType.qwen2_7b_instruct, max_model_len=2048)
infer_main(infer_args)
（这部分没问题，可以实现与模型对话，并且最后用exit退出了）

5.微调模型

以下是教程原文
本文使用LoRA的方法对Qwen进行微调。考虑到自我认知训练涉及知识编辑，我们不仅将注意力机制中的Linear层作为LoRA的目标模块，还增加了MLP中的Linear层，将lora_target_modules设置为'ALL'。我们将alpaca-zh和alpaca-en作为通用数据集和swift构建的自我认知数据集进行混合，以确保对模型自我认知的修改同时能够保持其在通用对话场景下的能力。

这里使用CLI的方式进行微调：
CUDA_VISIBLE_DEVICES=0 \
swift sft \
--model_type qwen2-7b-instruct \
--dataset alpaca-zh#500 alpaca-en#500 self-cognition#500 \
--logging_steps 5 \
--max_length 2048 \
--learning_rate 1e-4 \
--output_dir output \
--lora_target_modules ALL \
--model_name 小黄 'Xiao Huang' \
--model_author 魔搭 ModelScope \

（卡在了这一步，输入代码框后运行报错：
SyntaxError: invalid decimal literal (426654503.py, line 5)）

不懂原理的小白，只是把代码都放进去先跑跑看，不知道为什么这一步会出错

稍微排了下版，求大佬解答

展开

收起

游客e3fpvoxz236ps 2024-10-05 11:57:32 1182 版权

1 条回答

写回答

取消提交回答

1941623231718325

表明在你的Python程序（文件名为426654503.py）的第5行中，存在一个无效的十进制字面量，你可以把这个打印出来看看是个什么值

2024-10-05 14:38:29

赞同 503 展开评论

相关问答

按照“15分钟掌握大模型自我认知微调，定制个人专属大模型”说明碰到的问题

631

0

0

大模型Lora微调的疑问

245

0

0

微调大模型的tokenize_function编写求教

294

0

0

qwen模型微调上传数据集时，如何书写数据集的本地路径？

360

0

0

qwen-long微调如何上传自己的数据集？

748

1

0

关于qwen2-vl微调最佳实践

948

1

0

在阿里云PAI-DSW完成微调的大模型，通过EAS部署为AI-web应用，如何开放为公网web应用

485

1

0

有没有详细一些的微调modelscope-funasr上模型的教程（非大模型）？

290

0

0

为什么我微调modelscope大模型时报错，让我升级内核啊？能升级吗？

247

1

0

modelscope微调后的多模态大模型Qwen-VL和graghrag相结合构建知识库的案例有嘛？

296

0

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

深度解析：Transformer 的“灵魂”——QKV 变换的物理直觉

图解强化学习｜手算无模型学习：蒙特卡罗与时序差分

基于神经网络、强化学习、模糊逻辑和小波相结合的混合方法控制欠驱动系统

基于NSGA-III进化算法的多目标电路优化器

田间杂草检测数据集分享（适用于YOLO系列深度学习分类检测任务）

相关解决方案

更多

零代码微调，打造领域专属大模型

触手可及，函数计算玩转 AI 大模型

告别低效沟通，使用大模型发起语音通话

构建大模型应用的安全防护体系

Kimi K2.5，开源万亿参数大模型

热门讨论

热门文章

如何修改通义千问的system prompt，以修改自定义名字

modelscope-funasr的SenseVoiceLarge模型在哪里啊？

请问微调开元模型qwe1.5b 和 7b 分别支持数据集的上下文长度是多少个汉字/token？

modelscope-funasr的 sense voice和funasr的底层asr能力是一样吗？

modelscope-funasr实现runtime编译成sdk后怎么支持说话人分离？

文本生成，更细致的参数设置，例如生成长度等等，这些有文档吗？

modelscope-funasr 热词如何设置？

如何下载llama模型到本地？

在modelscope-funasr针对中文通话 SenseVoice和paraforma效果谁好？

modelscope-funasr实时设别，mode:2pass 还是online，2个有啥不一样？

展开全部

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

Cline：29.7K Star！一文详解VSCode最强开源AI编程搭子：一键生成代码+自动跑终端+操控浏览器...

CodeArena：在线 LLM 编程竞技场！用于测试不同开源 LLM 的编程能力，实时更新排行榜

使用宝塔面板部署 AstrBot 与 NapCat 实现 QQ 机器人

RAG+AI工作流+Agent：LLM框架该如何选择，全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐

Qlib：华尔街颤抖！微软开源金融AI量化投资神器，助力智能投研

Yuxi-Know：开源智能问答系统，基于大模型RAG与知识图谱技术快速构建知识库

FireCrawl：开源 AI 网络爬虫工具，自动爬取网站及子页面内容，预处理为结构化数据

Jina Reader：一键将网页内容转为适合 LLM 处理的文本格式，自动抓取和清洗网页内容，支持多种输出格式

展开全部

还有其他疑问?