文档备案控制台

开发者社区 ModelScope模型即服务正文

llm模型微调该如何替换为自己上传的数据集。

import os
os.environ['CUDA_VISIBLE_DEVICES'] = '0'

import torch

from swift.llm import (
DatasetName, InferArguments, ModelType, SftArguments,
infer_main, sft_main, app_ui_main, merge_lora
)

model_type = ModelType.qwen_7b_chat
sft_args = SftArguments(
model_type=model_type,
train_dataset_sample=2000,
dataset=[DatasetName.blossom_math_zh],# 此处该如何替换为自己创建的数据集？
output_dir='output')
result = sft_main(sft_args)
best_model_checkpoint = result['best_model_checkpoint']
print(f'best_model_checkpoint: {best_model_checkpoint}')
torch.cuda.empty_cache()

infer_args = InferArguments(
ckpt_dir=best_model_checkpoint,
load_dataset_config=True,
val_dataset_sample=10)
result = infer_main(infer_args)
torch.cuda.empty_cache()

app_ui_main(infer_args)

展开

收起

1194753440096176 2024-05-08 22:09:49 239 版权

0 条回答

写回答

取消提交回答

相关问答

使用阿里云ECS DeepGPU后，LLM微调训练场景和Stable Diffusion推理场景的性

159

1

0

通义灵码能不能自定义LLM模型？

621

1

0

咱们OpenSearch这边的LLM智能问答，使用的是什么大模型和模型算法？

203

1

0

ModelScope llm微调用python的时候，怎么使用自己的数据集？

117

0

0

LLM大模型对商业分析有哪些具体价值？

162

1

0

《七天入门LLM大模型》系列里面的例子是不是都可以用在线ModelScope的Note book跑？

119

1

0

modelscope-funasr这个LLM_ASR是什么模型呢？

174

1

0

OpenSearch LLM智能问答的1cu具体是什么？

241

1

0

在OpenSearch LLM智能问答我买了资源包了为什么没有服务呢？

172

1

0

我们这边再填写算法备案的内容，请问一下我们OpenSearch LLM智能问答版的算法性能是多少？

181

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

相关解决方案

更多

零代码微调，打造领域专属大模型

OpenAI 重磅开源，快速部署GPT-OSS模型

模型蒸馏：让0.6B模型媲美235B模型

文档智能与 RAG 构建 LLM 知识库

一键训练模型及部署GPU共享推理服务

热门讨论

热门文章

CoPAW配置后，对话，出现 AGENT_UNKNOWN_ERROR 如何解决

部署coclaw，报错如下，怎么办？应该点击哪里？

copaw安装后，出现这个情况，在设置模型的过程中出现这个问题，如何解决

云端部署coclaw报错

com/action/joingroup?code=v1是什么意思

ModelScope中，模型下载默认路径在哪个路径？

我下载的gguf文件，最新的LMSTUDIO仍然无法识别什么问题

copaw安装后选择ollma为啥报错不能安装相关模型？

dataset的版本问题导致与modelscope不兼容

ModelScope中apikey在哪申请？

展开全部

OpenClaw（原 Clawdbot）钉钉对接保姆级教程手把手教你打造自己的 AI 助手

保姆级 OpenClaw （原 Clawdbot）飞书对接教程手把手教你搭建 AI 助手

Qwen3.5 中等规模模型系列正式开源：更强智能，更低算力

MiniMax M2.5 开源，低成本Agent时代来了！社区Day0部署、工具调用、推理&提示词参数实战来啦！

Qwen3.5：迈向原生多模态智能体

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

别再用 LangChain 搭 RAG 了：Dify 和 n8n 哪个才是你真正需要的

OpenClaw 注册 Moltbook 教程让你的个人 OpenClaw Agent 加入全球最大 AI 社区

展开全部

还有其他疑问?