开发者社区 > ModelScope模型即服务 > 多模态 > 正文

对于ofa 6b en 模型,当我们使用pipline时能否一张图片生成多个句子?

对于image caption任务, ofa的其他模型,huggingface上可以找到,并且有一个参数 num_return_sequences 可以控制给定一张图片生成的句子个数,但是对于最大的模型ofa_image-caption_coco_6b_en只有mindscope才有,当我们使用pipline时能否一张图片生成多个句子?mindscope是否有相关参数?

展开
收起
7riubkyt6up2w 2022-12-03 08:04:59 1349 0
1 条回答
写回答
取消 提交回答
  • 你好,目前modelscope还没有支持多个返回,如果想要改成多个返回句子,可以修改modelscope/models/multi_model/ofa_for_all_tasks.py 修改_text_gen_inference中取generator返回值的地方。将decode_tokens = gen_out[0]['tokens'] 中的0遍历取beamsize个的返回值。

    这个功能我们后面会加在正式code里面,随版发布。

    2022-12-05 09:54:39
    赞同 展开评论 打赏

包含图像描述、文本生成图片、版面分析、多模态表征、视觉问答、文档理解等多个领域

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载