备案控制台

开发者社区 ModelScope模型即服务计算机视觉正文

想问一下ModelScope Qwen大模型微调有官方的评估指标和代码吗？

想问一下ModelScope Qwen大模型微调有官方的评估指标和代码吗？用测试集评估模型微调的好坏

展开

收起

真的很搞笑 2023-11-16 07:52:54 234 版权

2 条回答

写回答

取消提交回答

sunrr

对于ModelScope的Qwen大模型微调，我没有找到官方的评估指标和代码。一般来说，对于自然语言处理任务，我们通常会使用诸如BLEU、ROUGE、METEOR等指标来评估模型的性能。这些指标可以帮助我们理解模型生成的文本与参考文本之间的相似度。

以下是一个使用BLEU指标评估模型性能的简单示例，使用了GPT-2的微调代码：

from transformers import GPT2LMHeadModel, GPT2Tokenizer
import torch

# 加载模型和分词器
model = GPT2LMHeadModel.from_pretrained("gpt2")
tokenizer = GPT2Tokenizer.from_pretrained("gpt2")

# 加载测试集
with open("test.txt", "r") as f:
    test_text = f.read()

# 对测试集进行编码
inputs = tokenizer(test_text, return_tensors="pt")

# 微调模型
outputs = model.generate(inputs)

# 解码输出
generated_text = tokenizer.decode(outputs[:, inputs.attrs["padding_idx"] + 1:], skip_special_tokens=True)

# 计算BLEU指标
from nltk.translate.bleu_score import sentence_bleu
bleu_score = sentence_bleu([test_text.split()], generated_text.split(), smoothing_function=None)

print("BLEU score:", bleu_score)

这只是一个基本的示例，实际使用时你可能需要根据你的具体需求来调整代码。

2023-11-29 17:29:19

赞同展开评论

芯在这

微调您参考一下这个文档https://github.com/modelscope/swift/blob/main/examples/pytorch/llm/README_CN.md，此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2023-11-16 09:07:46

赞同展开评论

相关问答

千问Qwen3 32B大模型部署需要什么配置的GPU服务器？

1122

1

0

请问语音大模型Qwen-ASR是否支持输出字级别的时间戳？

86

0

0

普通轻薄本能跑哪些多模态大模型

313

1

0

modelscope-funasr微调时日志结果没有cer_att指标

47

0

0

千问Qwen3 14B大模型部署最低配置GPU服务器要求？

1039

1

0

Qwen3 32B,14B,8B大模型部署分别需要多少显存，GPU服务器如何选？

3118

1

0

千问大模型Qwen3-8B、4B、32B、235B、0.6B参数含义，需要什么配置的服务器部署？

758

1

0

部署大模型Qwen3 32B,14B,8B参数的大模型部署分别需要多少显存？

3038

1

0

Qwen3大模型中0.6B 4B 32B 235B参数是什么意思？

327

1

0

完全无法连接互联网的情况下，如何在vscode中登录通义灵码并远程链接到内网超算服务器上的大模型？

242

1

0

ModelScope模型即服务

计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

我要提问

相关文章

FFmpeg 官方汇编课程：写出快 5 倍的视频处理代码

【Github热门项目】DeepSeek-OCR项目上线即突破7k+星！突破10倍无损压缩，重新定义文本-视觉信息处理

程序员都在偷偷用的AI编程神器！2025高效自动写代码工具全解析

实力强劲的机器视觉公司有哪些：2025年TOP5精选榜单

2025 年度机器视觉公司有哪些：从技术实力到落地案例的全方位选型参考

热门讨论

热门文章

我希望通过damo-YOLO训练1500*1500的图片

ModelScope中，模型下载默认路径在哪个路径？

ModelScope下载速度慢怎么解决？

如何下载modelscope模型？

com/action/joingroup?code=v1是什么意思

服务器上onnxruntime-gpu 调用结束，如何释放显存

在ModelScope中，下载模型时的ssl问题怎么解决？!

modelscope这个下载有点慢呀，好几次都超时了，怎么解决？

ModelScope通义千问是多大的模型参数，收费标准跟7B有差距吗？

ModelScope的PAI-DSW中，怎么上传一个文件夹？

展开全部

Qwen2.5-VL：阿里通义千问最新开源视觉语言模型，能够理解超过1小时的长视频

Manga Image Translator：开源的漫画文字翻译工具，支持多语言翻译并嵌入原图，保持漫画的原始风格和布局

video-analyzer：开源视频分析工具，支持提取视频关键帧、音频转录，自动生成视频详细描述

LHM：单图生成3D动画人！阿里开源建模核弹，高斯点云重构服装纹理

X-AnyLabeling：开源的 AI 图像标注工具，支持多种标注样式，适于目标检测、图像分割等不同场景

AddressCLIP：一张照片就能准确定位！中科院联合阿里云推出街道级图像地理定位模型

STAR：南京大学联合字节开源视频超分辨率增强生成框架，视频清晰度一键提升，支持从低分辨率视频生成高分辨率视频

SPAR3D：一张图片就能生成3D模型，每个物体的重建时间仅需0.7秒！

ColorFlow：腾讯和清华大学联合推出的图像序列着色模型，通过参考图像的颜色对黑白漫画进行着色生成彩色漫画

InvSR：开源图像超分辨率生成模型，提升分辨率，修复老旧照片为超清图像

展开全部

还有其他疑问?