开发者社区 > ModelScope模型即服务 > 正文

modelscope训练中希望同时引入多个metric指标该怎么做

已解决

我正在进行VQA任务的微调,默认的cfg.evaluation.metrics = 'accuracy',
我希望同时使用accuracy、blue4、f1这几个指标评估任务的结果,是否可以通过什么办法来直接调用?
还是说我一定要重载一个class VQAMetric类来自行完成这个结果?

展开
收起
游客b5222ymaeufg2 2024-03-10 23:25:56 112 0
4 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。
    采纳回答

    你可以通过修改cfg.evaluation.metrics的值来实现同时使用accuracy、blue4、f1这几个指标评估任务的结果。将cfg.evaluation.metrics设置为一个包含这些指标的列表,例如:

    cfg.evaluation.metrics = ['accuracy', 'blue4', 'f1']
    

    这样,你的模型在评估时将会同时计算这三个指标。

    2024-03-11 13:16:49
    赞同 展开评论 打赏
  • 在微调VQA(Visual Question Answering)任务时,如果你正在使用的库或框架默认只配置了accuracy作为评估指标,而你希望同时使用accuracy、BLEU-4和F1分数来评估模型性能,通常情况下需要检查所用库或框架是否支持直接添加额外的评估指标。

    例如,在Hugging Face Transformers库中,可以通过compute_metrics函数来自定义多个评估指标。对于不同的VQA实现,处理方式可能会有所不同:

    1. Transformers库配合Trainer类
      如果你在使用Hugging Face的Trainer进行训练和评估,可以重写或提供一个自定义的compute_metrics函数,该函数会返回包含所有所需指标的字典。

    2. 其他深度学习框架如PyTorch或TensorFlow

      • 对于自定义评估逻辑,可能需要修改评估循环或者后处理部分代码,手动计算所需的额外指标。
      • 若所用库已经集成了这些指标,比如对于文本生成任务常常有的BLEU等评价指标,只需正确导入并调用相应的计算方法即可。
    3. 特定VQA库
      某些专门为VQA任务设计的库(如ViLBERT、LXMERT等)可能提供了扩展评估指标的功能。你需要查阅库的具体文档以了解如何添加额外的评估指标。

    总结一下,具体做法取决于你的环境和工具链,但大部分情况下无需从头创建一个新的类,而是找到合适的地方添加对新评估指标的支持。如果框架不直接支持,那么可能需要编写一些额外的代码来计算这些指标并在评估结束后输出结果。

    2024-03-11 10:38:17
    赞同 1 展开评论 打赏
  • 阿里云大降价~

    在ModelScope中,你可以通过修改配置文件来同时引入多个评估指标。在你的VQA任务的配置文件中,将cfg.evaluation.metrics的值更改为一个包含所需指标的列表,例如:

    cfg.evaluation.metrics = ['accuracy', 'blue4', 'f1']
    

    这样,你的模型将在训练过程中同时使用accuracy、blue4和f1这三个指标进行评估。无需重载一个VQAMetric类来实现这个功能。

    2024-03-11 10:25:13
    赞同 展开评论 打赏
  • 十分耕耘,一定会有一分收获!

    楼主你好,据我所知阿里云VQA任务的微调中,默认的评估指标是accuracy,如果你想同时使用accuracy、blue4、f1这几个指标来评估任务的结果,你可以通过以下两种方式来实现:

    1. 重载VQAMetric类:你可以重载VQAMetric类,并在其中定义你想要使用的指标,比如blue4和f1。然后在训练过程中调用这个自定义的评估指标即可。

    2. 修改evaluate函数:在训练代码中找到evaluate函数(一般在trainer.py中),将其中的评估指标修改为你想要使用的指标,比如将cfg.evaluation.metrics = 'accuracy'修改为cfg.evaluation.metrics = ['accuracy', 'blue4', 'f1']。这样训练过程中就会同时计算accuracy、blue4和f1这几个指标并输出结果。

    2024-03-11 09:01:23
    赞同 展开评论 打赏

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

热门讨论

热门文章

相关电子书

更多
视觉AI能力的开放现状及ModelScope实战 立即下载
ModelScope助力语音AI模型创新与应用 立即下载
低代码开发师(初级)实战教程 立即下载