文档备案控制台

开发者社区 ModelScope模型即服务正文

llm模型微调该如何替换为自己上传的数据集。

import os
os.environ['CUDA_VISIBLE_DEVICES'] = '0'

import torch

from swift.llm import (
DatasetName, InferArguments, ModelType, SftArguments,
infer_main, sft_main, app_ui_main, merge_lora
)

model_type = ModelType.qwen_7b_chat
sft_args = SftArguments(
model_type=model_type,
train_dataset_sample=2000,
dataset=[DatasetName.blossom_math_zh],# 此处该如何替换为自己创建的数据集？
output_dir='output')
result = sft_main(sft_args)
best_model_checkpoint = result['best_model_checkpoint']
print(f'best_model_checkpoint: {best_model_checkpoint}')
torch.cuda.empty_cache()

infer_args = InferArguments(
ckpt_dir=best_model_checkpoint,
load_dataset_config=True,
val_dataset_sample=10)
result = infer_main(infer_args)
torch.cuda.empty_cache()

app_ui_main(infer_args)

展开

收起

1194753440096176 2024-05-08 22:09:49 298 版权

0 条回答

写回答

取消提交回答

相关问答

使用阿里云ECS DeepGPU后，LLM微调训练场景和Stable Diffusion推理场景的性

214

1

0

通义灵码能不能自定义LLM模型？

943

1

0

咱们OpenSearch这边的LLM智能问答，使用的是什么大模型和模型算法？

284

1

0

ModelScope llm微调用python的时候，怎么使用自己的数据集？

176

0

0

LLM大模型对商业分析有哪些具体价值？

247

1

0

《七天入门LLM大模型》系列里面的例子是不是都可以用在线ModelScope的Note book跑？

209

1

0

modelscope-funasr这个LLM_ASR是什么模型呢？

228

1

0

OpenSearch LLM智能问答的1cu具体是什么？

343

1

0

在OpenSearch LLM智能问答我买了资源包了为什么没有服务呢？

250

1

0

我们这边再填写算法备案的内容，请问一下我们OpenSearch LLM智能问答版的算法性能是多少？

278

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

相关解决方案

更多

零代码微调，打造领域专属大模型

GLM-5.2：长任务时代开源旗舰模型

基于 Spark 和 PyTorch 的模型训练方案

OpenAI 重磅开源，快速部署GPT-OSS模型

模型蒸馏：让0.6B模型媲美235B模型

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

com/action/joingroup?code=v1是什么意思

ModelScope下载速度慢怎么解决？

ModelScope镜像地址是什么？

cuda 是11.3，ModelScope的mmcv怎么安装？

ModelScope中，灵积模型服务怎么看账单比如如何看我的免费token额度还剩下多少?

modelscope-funasr的onnxruntime c++只能使用onnx结尾的模型吗？

ModelScope这个免费额度可以在哪里查询啊？

【DCT-Net人像卡通化】生成图像颜色诡异暗青色

modelscope cache 环境变量是啥？

展开全部

中企投资印度新能源“有戏”吗？

高效部署通义万相Wan2.1：ComfyUI文生/图生视频实战，工作流直取！

2026 最新Stable Diffusion 本地部署教程下载安装使用详细图解（含官网安装包）

GLM-4V-Flash：智谱 AI 免费开放的图像理解大模型 API 接口

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

DeepSeek-V4开源：百万上下文，Agent能力比肩顶级闭源模型

Seedance vs Sora vs Kling：AI 视频生成模型深度对比

Claude Code 四大定制机制完全指南：CLAUDE.md、Hooks、Skills、Subagents 怎么选怎么用

docker安装部署FunASR

展开全部

还有其他疑问?