文档备案控制台

开发者社区 ModelScope模型即服务正文

ModelScope评测就一个指标吗？还是说可以选择？

"ModelScope评测就一个指标吗？还是说可以选择？
这是我提交的脚本CUDA_VISIBLE_DEVICES=0 swift eval \
--model_type qwen1half-4b-chat \
--model_id_or_path /data/public/qim/model/Qwen1.5-4B-Chat \
--infer_backend vllm \
--template_type qwen \
--eval_dataset mmlu \
--eval_limit 100 \
--name qwen1half-4b-chat-mmlu \
--eval_output_dir /data/public/qim/model/eval/outputs \
--dtype=fp16 \
--gpu_memory_utilization 0.6 \
--max_model_len 16384"

展开

收起

小小爱吃香菜 2024-07-17 08:19:03 226 版权

1 条回答

写回答

取消提交回答

为了利利

是跟具体的benchmark绑定的，一般来说客观题就是acc；主观题、agent和多模态后面小版本会开放，指标可能是别的，比如rouge-l、clip-score等metrics。此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-07-17 13:02:50

赞同 4 展开评论

相关问答

modelscope-funasr微调时日志结果没有cer_att指标

190

0

0

modelscope-funasr微调训练的过程中，为什么log里面没有cer_ctc这个指标？

251

0

0

modelscope-funasr在微调的时候怎么没有计算字符错误率的指标？

382

1

0

modelscope-funasr的qwenaudio对数据集解码之后生成的cnt指标是什么？

218

0

0

ModelScope直接使用eval-scope进行评测的时候，总是报图中错误，怎么解决？

549

1

0

ModelScope中，关于不同参数量大模型部署推理的硬件配比指标，有参考吗？

207

0

0

ModelScope中，vllm会有少量精度损失，这个有对比指标吗？

397

1

0

modelscope-funasr没有看到validate过程的指标是什么原因嘞？

160

1

0

modelscope-funasr语音识别，有评估指标吗？

242

1

0

ModelScope模型报下图这样的错误怎么解决呢？

276

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

相关文章

2026年阿里云 GPU 云服务器配置价格表及测评

2026年阿里云服务器价格表：轻量、ECS、GPU云服务器最新配置与定价详解

阿里云轻量应用服务器、ECS云服务器、GPU云服务器最新配置与价格说明

2026年阿里云ECS、轻量、GPU云服务器、百炼大模型配置价格与活动权益详解

海外用户如何进行阿里云账号实名认证：痛点剖析与全渠道通关指南！！！

热门讨论

热门文章

com/action/joingroup?code=v1是什么意思

ModelScope中，模型下载默认路径在哪个路径？

ModelScope下载速度慢怎么解决？

ModelScope中，灵积模型服务怎么看账单比如如何看我的免费token额度还剩下多少?

ModelScope这个免费额度可以在哪里查询啊？

IndexTTS 部署报错：No module named 'tn'

我下载的gguf文件，最新的LMSTUDIO仍然无法识别什么问题

modelscope-funasr的onnxruntime c++只能使用onnx结尾的模型吗？

ModelScope免费额度完了，在哪里购买？

在魔塔社区-模型服务里面一键部署的deepseek模型怎么使用？

展开全部

Gemini 3.5 Pro 泄露刷屏！前端一次成型赶超 Fable 5，7 月 17 日或将亮相

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

DeepSeek-V4开源：百万上下文，Agent能力比肩顶级闭源模型

GLM-4V-Flash：智谱 AI 免费开放的图像理解大模型 API 接口

Claude Code 四大定制机制完全指南：CLAUDE.md、Hooks、Skills、Subagents 怎么选怎么用

Codex 完整避坑指南（2026 版）：沙箱、权限、AGENTS.md、Worktree 七类坑一次讲清

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

分层结构化决策对话智能体灵钥 V5.1 全新升级｜具备观点边界、关系感知的深度思辨 Agent，配套线上 Demo 与真实用户数据采集方案

高效部署通义万相Wan2.1：ComfyUI文生/图生视频实战，工作流直取！

展开全部

还有其他疑问?