OFA大模型

简介: OFA大模型简介

【Task简介】

OFA(One-For-All)对不同模态和任务实现了输入输出、架构、任务的大统一,在各多模态任务取得SOTA结果,Caption任务第一名。目前在ModelScope上已经上线了图像描述、图像生成、文本分类、摘要等8个下游任务,有不同规格和不同语种的支持,后续还会继续上线更多的模态和模型已经更有意思的应用。


【说明视频】



【输入与输出】

根据细分场景需求,按照输入要求输入图片或者文字,会产出相应的结果数据

【场景应用】

图像描述能力可以帮助用户为图片自动产出一段文本,既能够方便快速晒图,也能方便对图片进行分类管理甚至辅助搜索。 视觉问答能力可以对图片提出特定的问题,比如可以自动化解决图片分类问题(照片里有人么?照片里有建筑么?)和自动导游(照片里的建筑叫什么名字?)


【数据集链接】

数据集:

https://modelscope.cn/datasets/modelscope/coco_2014_caption/files

https://modelscope.cn/models?name=ofa&page=1%20caption

模型文件:

https://modelscope.cn/models/damo/ofa_image-caption_coco_large_en/summary

相关文章
|
存储 C++ Python
【数据结构】哈希表—C/C++实现
【数据结构】哈希表—C/C++实现
249 0
|
机器学习/深度学习 数据采集 自然语言处理
ModelScope保姆式教程带你玩转语言生成模型
PALM预训练语言生成模型是针对实际场景中常见的文本生成需求所设计的一个模型。模型利用大量无监督数据,通过结合自编码和自回归任务进行预训练,更贴合下游生成任务所同时需要的理解和生成能力。
34931 4
ModelScope保姆式教程带你玩转语言生成模型
SAP扩充物料的销售视图
比如我们现在有一个物料,这个物料只具备基本视图,我们如何为这个物料补充销售视图呢?先看看这个物料,使用事务码MM03我们无法使用MM02去扩充视图,我们需要使用MM50为它扩充销售视图。维护执行之后,进入类似于MM01的画面,如下图看,我们可以开始扩充这个物料的销售视图了。
4680 0
|
机器学习/深度学习 人工智能 自然语言处理
“魔搭”来了!一文深度解读达摩院推出的AI模型社区
一文详解ModelScope魔搭社区,模型即服务开启AI开发使用新范式
10217 12
“魔搭”来了!一文深度解读达摩院推出的AI模型社区
|
SQL 数据库
SQL Server 如何进行备份?
【8月更文挑战第20天】SQL Server 如何进行备份?
495 3
|
存储 弹性计算 算法
SSH学习(三)- SSH协议中的Public Key Algorithm
在SSH协议中,有两个地方涉及到公钥算法,分别是: 1. 服务端认证:服务端在进行密钥协商的时候证明自己身份,防止中间人攻击,此时为SSH-TRANS协议发生的事情; 2. 客户端认证:客户端通过PublicKey方式证明自己身份,完成SSH登录认证,此时SSH-USERAUTH发生的事情; 这两种情况下的公钥算法使用的是同一个概念,接下来本文将主要基于PublicKey公钥认证方式,学习对应的内容。
1729 1
SSH学习(三)- SSH协议中的Public Key Algorithm
|
Linux Shell 网络安全
在Linux中,rsync同步时,如何删除目标数据多出来的数据,即源上不存在,但目标却存在的文件或者目录?
在Linux中,rsync同步时,如何删除目标数据多出来的数据,即源上不存在,但目标却存在的文件或者目录?
|
XML Java 数据库连接
MyBatis核心配置文件解析: 一步步深入理解mybatis-config.xml
MyBatis核心配置文件解析: 一步步深入理解mybatis-config.xml
1858 0
MyBatis核心配置文件解析: 一步步深入理解mybatis-config.xml
|
机器学习/深度学习 JSON 自然语言处理
ModelScope模型库体验之OFA模型实现英文视觉定位
OFA(One-For-All)是通用多模态预训练模型,使用简单的序列到序列的学习框架统一模态(跨模态、视觉、语言等模态)和任务(如图片生成、视觉定位、图片描述、图片分类、文本生成等)
1301 0
ModelScope模型库体验之OFA模型实现英文视觉定位

热门文章

最新文章