开发者社区 > ModelScope模型即服务 > 多模态 > 正文

mPLUG图像描述模型是什么?

图像描述:给定一张图片,模型根据图片信息生成一句对应描述。可以应用于给一张图片配上一句文字或者打个标签的场景。本页面右侧提供了在线体验的服务,欢迎使用!注:本模型为mPLUG-图像描述的Base模型,参数量约为3.5亿。

展开
收起
ModelScope运营小助手 2022-10-28 16:57:27 2006 0
1 条回答
写回答
取消 提交回答
  • 您好,mPLUG图像描述模型是输入一张图片,模型根据图片里的信息生成一段描述该图片的文本,可以应用于图片标题生成、图片打标等场景

    2022-11-09 09:43:08
    赞同 展开评论 打赏

包含图像描述、文本生成图片、版面分析、多模态表征、视觉问答、文档理解等多个领域

相关电子书

更多
基于视觉推理的视频理解 立即下载
基于神经网络的语言合成 立即下载
深度学习论文实现:空间变换网络-第一部分 立即下载