文档备案控制台

开发者社区 ModelScope模型即服务多模态正文

对于ofa 6b en 模型，当我们使用pipline时能否一张图片生成多个句子？

对于image caption任务， ofa的其他模型，huggingface上可以找到，并且有一个参数 num_return_sequences 可以控制给定一张图片生成的句子个数，但是对于最大的模型ofa_image-caption_coco_6b_en只有mindscope才有，当我们使用pipline时能否一张图片生成多个句子？mindscope是否有相关参数？

展开

收起

7riubkyt6up2w 2022-12-03 08:04:59 1628 版权

1 条回答

写回答

取消提交回答

ModelScope多模态小助手

你好，目前modelscope还没有支持多个返回，如果想要改成多个返回句子，可以修改modelscope/models/multi_model/ofa_for_all_tasks.py 修改_text_gen_inference中取generator返回值的地方。将decode_tokens = gen_out[0]['tokens'] 中的0遍历取beamsize个的返回值。

这个功能我们后面会加在正式code里面，随版发布。

2022-12-05 09:54:39

赞同展开评论

相关问答

购买阿里国外的云服务器是否可以访问谷歌？

92896

50

0

this xml file does not appear to have any style in

61443

11

0

访问ECS服务器的网站提示“由于你访问的URL可能对网站造成安全威胁，您的访问被阻断”，这是什么原因？

142250

16

0

C语言数组赋值报错，打印出来的是乱码，怎么解决？

1627

1

0

#支付宝授权提示请在支付宝客户端打开链接

24976

19

0

阿里云怎样设置二级域名以及域名解析？

66944

14

0

支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】

284831

11

0

基础语言百问-Python

69756

30

0

C语言中default使用注意事项是什么？

1656

1

0

搭建dnf私服需要大概啥配置的

10473

2

0

ModelScope模型即服务

多模态

包含图像描述、文本生成图片、版面分析、多模态表征、视觉问答、文档理解等多个领域

我要提问

收录在圈子:

多模态模型

176

+ 订阅

相关文章

工程师思维看透人心？这个“集成框架”可能颠覆了个人成长领域

别再只依赖 ChatGPT 了：多模型协同，才是 AI 项目走向生产的关键一步

从统计相关性到结构性必然性：一个解决AI幻觉与对齐问题的框架探讨

Claude Code 源码泄露，升级 OpenClaw 的研究方案

🔥【零基础逆袭】我用Python写了个量化策略，3天赚了别人3年的钱！（附完整代码+教程）

相关解决方案

更多

GLM-5.2：长任务时代开源旗舰模型

模型蒸馏：让0.6B模型媲美235B模型

OpenAI 重磅开源，快速部署GPT-OSS模型

基于 Spark 和 PyTorch 的模型训练方案

一键训练模型及部署GPU共享推理服务

热门讨论

热门文章

下载youku-mplug的Video Captioning数据集时报错。

通过ollama 编写modelfile的形式创建翻译模型，输出全是思考，老是超限，翻译不出来。

怎么修改model scope的默认存储位置

普通轻薄本能跑哪些多模态大模型

该模型在在线环境使用下运行报错。

!pip install open_clip_torch !pip install pytorch-

你好，在官方提供的实例上运行，报了下图错误。即使把modelscope库更新到1.8.4还是存在问题

中文CLIP模型卷土重来，这次加量不加价！

这个有美化提示词的作用吗？以及可以美化中文提示词吗？

关于存储路径

展开全部

GLM-4V-Flash：智谱 AI 免费开放的图像理解大模型 API 接口

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

阿里开源AI视频生成大模型 Wan2.1：14B性能超越Sora、Luma等模型，一键生成复杂运动视频

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

AnythingLLM：34K Star！一键上传文件轻松打造个人知识库，构建只属于你的AI助手，附详细部署教程

AstrBot：轻松将大模型接入QQ、微信等消息平台，打造多功能AI聊天机器人的开发框架，附详细教程

音乐人必看！OpenUtau：开源AI歌声合成神器，快速打造专业级虚拟歌手，中文日文无缝切换

推荐一款可以简单快速部署开源AI模型的桌面软件 Doo AI

用自然语言控制电脑，字节跳动开源 UI-TARS 的桌面版应用！内附详细的安装和配置教程

Mobile-Agent：通过视觉感知实现自动化手机操作，支持多应用跨平台

展开全部

还有其他疑问?