文档备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

微调大模型的tokenize_function编写求教

最近在学习大模型，关于tokenize_function或者preprocess_function,GPT等大模型给出的代码demo中通常会有2个版本：

def preprocess_function(examples):
    inputs = [ex["input"] for ex in examples]
    targets = [ex["output"] for ex in examples]
    model_inputs = tokenizer(inputs, max_length=512, truncation=True, padding="max_length")
    labels = tokenizer(targets, max_length=512, truncation=True, padding="max_length")["input_ids"]
    model_inputs["labels"] = labels
    return model_inputs

def preprocess_function(examples):
    inputs = examples["text"]
    model_inputs = tokenizer(inputs, max_length=512, truncation=True, padding="max_length")
    labels = model_inputs["input_ids"].copy()
    model_inputs["labels"] = labels
    return model_inputs

前者是将模型的输出传给labels，后者是将整个文本传给labels
两种数据结构背后的训练逻辑看起来完全不一样啊，我到底应该用哪一种？还是说选择哪一种逻辑跟代码其他的设置相关？

展开

收起

游客pkday7jizkisy 2025-03-07 07:59:30 332 版权

0 条回答

写回答

取消提交回答

相关问答

按照“15分钟掌握大模型自我认知微调，定制个人专属大模型”说明碰到的问题

658

0

0

qwen模型微调上传数据集时，如何书写数据集的本地路径？

398

0

0

qwen-long微调如何上传自己的数据集？

787

1

0

关于qwen2-vl微调最佳实践

1005

1

0

在阿里云PAI-DSW完成微调的大模型，通过EAS部署为AI-web应用，如何开放为公网web应用

540

1

0

小白求助，跟着大模型微调教程做不太明白

1231

1

0

有没有详细一些的微调modelscope-funasr上模型的教程（非大模型）？

318

0

0

为什么我微调modelscope大模型时报错，让我升级内核啊？能升级吗？

279

1

0

阿里云百炼微调的图片直接用qwen-vl-plus模型输出正常，但是超过10张图片后报错，为什么？

548

1

0

ModelScope我微调Qwen2-7B-Instruct,loss一直不变是什么原因？

366

1

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

阿里云自然语言处理全栈对接指南：从入门到企业级集成实战

MCP 工具生态升温后，企业 AI 中台要解决什么问题？

告别单轮静态测评！WorldForge 多动态环境基准，量化 Agent 组件协同能力

分层结构化决策对话智能体灵钥 V5.1 全新升级｜具备观点边界、关系感知的深度思辨 Agent，配套线上 Demo 与真实用户数据采集方案

从零搓一个语言模型，然后把它变成认知体的声带

热门讨论

热门文章

modelscope-funasr 热词如何设置？

modelscope-funasr的SenseVoiceLarge模型在哪里啊？

在modelscope-funasr针对中文通话 SenseVoice和paraforma效果谁好？

如何下载llama模型到本地？

如何修改通义千问的system prompt，以修改自定义名字

modelscope-funasr这个长音频版本，我生成的还是没有标点，为什么？

modelscope-funasr这个报错怎么处理？

我是一个小白，本机部署adaseq，vscode找不到modelscope的module

modelscope-funasr如何释放显存呢？

部署funasr-sdk-cpu-0.4.7，无法切换vad为8k模型，提示不存在v2.0.6版本

展开全部

分层结构化决策对话智能体灵钥 V5.1 全新升级｜具备观点边界、关系感知的深度思辨 Agent，配套线上 Demo 与真实用户数据采集方案

使用宝塔面板部署 AstrBot 与 NapCat 实现 QQ 机器人

告别单轮静态测评！WorldForge 多动态环境基准，量化 Agent 组件协同能力

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

Cline：29.7K Star！一文详解VSCode最强开源AI编程搭子：一键生成代码+自动跑终端+操控浏览器...

RAG+AI工作流+Agent：LLM框架该如何选择，全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐

语义压缩，才是提示词工程的底层心法

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

Yuxi-Know：开源智能问答系统，基于大模型RAG与知识图谱技术快速构建知识库

测试工程师要失业？Magnitude：开源AI Agent驱动的端到端测试框架，让Web测试更智能，自动完善测试用例！

展开全部

还有其他疑问?