文档备案控制台

开发者社区 ModelScope模型即服务正文

modelscope用swift微调加载微调后的模型，设置哪些参数能增加GPU、CPU的效率？

modelscope用swift微调加载微调后的模型，设置哪些参数能增加GPU、CPU的效率？

展开

收起

小小爱吃香菜 2024-04-02 22:16:43 214 版权

1 条回答

写回答

取消提交回答

为了利利

"感觉像是您的统计时间把get_model_tokenizer耗时也包含了，您换下面这种推理看看。
用vllm的话，要merge权重。此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”"

2024-04-02 22:49:49

赞同展开评论

相关问答

请问如何使用ms-swift工具验证模型微调的效果？

572

0

0

modelscope-funasr怎么设置使得模型可以用CUDA0以外的其他gpu？

34165

1

0

请问用modelscope里swift的dpo微调模型的断点Debug方式，有相关文档说明吗？

654

1

0

ModelScope我试着用swift 微调后微调的模型都失去逻辑怎么办？

325

1

0

modelscope-funasr最新的gpu高吞吐服务用的模型和原来cpu的参数量是一样的么？

395

0

0

modelscope-funasr最新的gpu高吞吐服务用的模型和原来cpu的是一样的么？

269

0

0

ModelScope没有看见复制，模型选择、cpu/GPU选择有特别要求吗，有详细说明吗？

295

1

0

请教大家，modelscope有能让图片中模糊文字变清晰的模型吗？

373

1

0

ModelScope刚训练完提问训练完的模型它就说答不出来，怎么处理？

199

1

0

modelscope-funasr的VAD模型能并发吗？

247

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

相关文章

HAMi - Kubernetes GPU 共享部署与使用手册

幂等性在大模型服务中的核心应用：解决重复请求、重复扣费与重复推理问题.171

跨境AI算力合规，我是怎么从来数加工转向Token调度的

实时云渲染是什么？一文读懂实时云渲染、WebGL 与像素流的核心区别

相关解决方案

更多

一键训练模型及部署GPU共享推理服务

零代码微调，打造领域专属大模型

GLM-5.2：长任务时代开源旗舰模型

基于 Spark 和 PyTorch 的模型训练方案

OpenAI 重磅开源，快速部署GPT-OSS模型

热门讨论

热门文章

com/action/joingroup?code=v1是什么意思

ModelScope中，模型下载默认路径在哪个路径？

ModelScope下载速度慢怎么解决？

cuda 是11.3，ModelScope的mmcv怎么安装？

modelscope-funasr的onnxruntime c++只能使用onnx结尾的模型吗？

ModelScope中，灵积模型服务怎么看账单比如如何看我的免费token额度还剩下多少?

ModelScope这个免费额度可以在哪里查询啊？

ModelScope免费额度完了，在哪里购买？

ModelScope镜像地址是什么？

我下载的gguf文件，最新的LMSTUDIO仍然无法识别什么问题

展开全部

中企投资印度新能源“有戏”吗？

Gemini 3.5 Pro 泄露刷屏！前端一次成型赶超 Fable 5，7 月 17 日或将亮相

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

高效部署通义万相Wan2.1：ComfyUI文生/图生视频实战，工作流直取！

GLM-4V-Flash：智谱 AI 免费开放的图像理解大模型 API 接口

Claude Code 四大定制机制完全指南：CLAUDE.md、Hooks、Skills、Subagents 怎么选怎么用

DeepSeek-V4开源：百万上下文，Agent能力比肩顶级闭源模型

Codex 完整避坑指南（2026 版）：沙箱、权限、AGENTS.md、Worktree 七类坑一次讲清

Hermes Agent：深度技术剖析报告

展开全部

还有其他疑问?