开发者社区> 问答> 正文

关于OFA图像描述模型,能否通过单个模型,单次推理中获得这些信息呢?

关于OFA图像描述模型,ofa_image-caption_coco_large_en 目前代码样例,是直接输出了 一句话描述 比如,一幅图里面,有两只鸟和一棵树,最终描述:两只鸟在一棵树上。 我希望 不仅得到 这样一句描述,是否在推断过程中,还存在 更丰富的数据,我这边可以通过调整代码获取到,比如 1)图片中有哪些对象:鸟1,鸟2,树 2)甚至他们的位置信息,颜色信息? 其它模型,可以实现这些,但是意味着需要加载多个模型,消耗更多资源。能否通过单个模型,单次推理中获得这些信息呢?

展开
收起
fuxixi 2022-11-21 10:42:49 146 0
1 条回答
写回答
取消 提交回答
  • 这个单个模型还能研究一下通过不同的prompt和inference策略实现,但是单次推断就做不到了,最起码解码策略要做多次。此答案整理自钉钉群“ModelScope开发者联盟群 ①”

    2022-11-21 15:11:02
    赞同 展开评论 打赏
来源圈子
更多
收录在圈子:
+ 订阅
技术图谱:由专家组参与技术图谱的绘制与编写,知识与实践的结合让开发者们掌握学习路线与逻辑,快速提升技能 电子书:电子书由阿里内外专家打造,供开发者们下载学习,更与课程相结合,使用户更易理解掌握课程内容 训练营:学习训练营 深入浅出,专家授课,带领开发者们快速上云 精品课程:汇集知识碎片,解决技术难题,体系化学习场景,深入浅出,易于理解 技能自测:提供免费测试,摸底自查 体验实验室:学完即练,云资源免费使用
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载