备案控制台

开发者社区 ModelScope模型即服务文章正文

大一统模型

2023-07-28 131

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

交互式建模 PAI-DSW，每月250计算时 3个月

模型在线服务 PAI-EAS，A10/V100等 500元 1个月

模型训练 PAI-DLC，5000CU*H 3个月

简介： 大一统模型

【Task简介】

OFA（One-For-All）对不同模态和任务实现了输入输出、架构、任务的大统一，在各多模态任务取得SOTA结果，Caption任务第一名。目前在ModelScope上已经上线了图像描述、图像生成、文本分类、摘要等8个下游任务，有不同规格和不同语种的支持，后续还会继续上线更多的模态和模型已经更有意思的应用。

【说明视频】

点击链接查看视频：

https://www.yuque.com/modelscope/rdum8e/on23pp?inner=mqyqQ

【输入与输出】

根据细分场景需求，按照输入要求输入图片或者文字，会产出相应的结果数据

【场景应用】

图像描述能力可以帮助用户为图片自动产出一段文本，既能够方便快速晒图，也能方便对图片进行分类管理甚至辅助搜索。视觉问答能力可以对图片提出特定的问题，比如可以自动化解决图片分类问题（照片里有人么？照片里有建筑么？）和自动导游（照片里的建筑叫什么名字？）

【数据集链接】

数据集：

https://modelscope.cn/datasets/modelscope/coco_2014_caption/files

https://modelscope.cn/models?name=ofa&page=1%20caption

模型文件：

https://modelscope.cn/models/damo/ofa_image-caption_coco_large_en/summary

ModelScope运营小助手

目录

相关文章

5i77ajz5u7ji6

|

6月前

|

存储算法测试技术

大模型落地的必经之路 | GPTQ加速LLM落地，让Transformer量化落地不再困难

大模型落地的必经之路 | GPTQ加速LLM落地，让Transformer量化落地不再困难

5i77ajz5u7ji6

245 0 0

楠竹11

|

11天前

|

机器学习/深度学习人工智能机器人

何恺明新作出炉！异构预训练Transformer颠覆本体视觉学习范式，AI性能暴涨超20%

【10月更文挑战第29天】在机器人学习领域，训练通用模型面临数据异构性的挑战。近期研究“Scaling Proprioceptive-Visual Learning with Heterogeneous Pre-trained Transformers”提出异构预训练Transformer（HPT），通过大规模预训练学习跨不同本体和任务的共享表示，显著提升了性能。实验结果显示，HPT在未见过的任务上表现优异，性能提升超过20%。

楠竹11

29 6 6

楠竹11

|

5月前

|

机器学习/深度学习语音技术

多模态大模型不够灵活，谷歌DeepMind创新架构Zipper：分开训练再压缩

【6月更文挑战第12天】谷歌DeepMind的Zipper架构解决了多模态大模型灵活性问题，通过分解为单模态模型并用“压缩”过程组合，实现多模态生成。该方法允许独立训练每个模态，提升灵活性和可扩展性，适用于数据有限或领域特定的模态。Zipper利用交叉注意力机制融合模态输出，适用于图像描述、语音识别等任务。尽管需要更多计算资源且性能受限于单模态模型质量，但已在ASR和TTS领域展现潜力。论文链接：https://arxiv.org/pdf/2405.18669

楠竹11

64 3 3

楠竹11

|

5月前

|

机器学习/深度学习人工智能算法

全面超越DPO：陈丹琦团队提出简单偏好优化SimPO，还炼出最强8B开源模型

【6月更文挑战第4天】普林斯顿大学陈丹琦团队推出SimPO，一种超越DPO的强化学习优化算法，旨在优化大型语言模型以符合人类价值观。SimPO通过序列平均对数概率作为奖励，提高计算效率并减少对参考模型的依赖。在多基准测试中，SimPO表现优秀，尤其在AlpacaEval 2和Arena-Hard上大幅超越现有方法。团队还基于Llama3-8B-Instruct创建了最强8B开源模型，推动AI技术发展。尽管存在超参数敏感性等挑战，SimPO仍为AI优化提供新途径。[论文链接](https://arxiv.org/pdf/2405.14734)

楠竹11

76 1 1

24k纯甄

|

5月前

|

机器学习/深度学习算法安全

【机器学习与大模型】开源大模型和闭源大模型：技术发展与社会责任的平衡点

【机器学习与大模型】开源大模型和闭源大模型：技术发展与社会责任的平衡点

24k纯甄

72 0 0

Skrrapper

|

6月前

|

人工智能自然语言处理安全

【大模型】基于AI和全球化进程的权衡：开源大模型与闭源大模型

【大模型】基于AI和全球化进程的权衡：开源大模型与闭源大模型

Skrrapper

119 0 0

楠竹11

|

6月前

|

人工智能自然语言处理测试技术

多模态大模型有了统一分割框架，华科PSALM多任务登顶，模型代码全开源

【4月更文挑战第24天】华中科技大学团队推出PSALM模型，革新多模态图像分割，实现语义、实例及交互式分割任务统一处理，提升效率。模型在多项基准测试中表现优异，支持零样本学习，适用于开放词汇分割等任务。代码开源促进研究，但面临复杂场景处理和计算资源优化的挑战。[链接](https://arxiv.org/abs/2403.14598)

楠竹11

212 2 2

楠竹11

|

6月前

|

机器学习/深度学习编解码人工智能

全面超越ViT，美团、浙大等提出视觉任务统一架构VisionLLAMA

【2月更文挑战第17天】全面超越ViT，美团、浙大等提出视觉任务统一架构VisionLLAMA

楠竹11

68 2 2

全面超越ViT，美团、浙大等提出视觉任务统一架构VisionLLAMA

楠竹11

|

6月前

|

机器学习/深度学习数据采集人工智能

ICLR 2024：RLHF有了通用平台和基准，天大开源，专攻现实决策场景

【4月更文挑战第21天】天津大学在ICLR 2024发布RLHF新框架Uni-RLHF，以人类反馈引导强化学习，降低奖励函数设计需求，适应现实决策场景。该框架提供通用平台和基准，支持大规模众包注释，促进研究。尽管面临准确捕捉人类反馈、数据质量和多任务处理等挑战，但开源特性加速了学术进步。[链接](https://arxiv.org/abs/2402.02423)

楠竹11

98 0 0

楠竹11

|

6月前

|

自然语言处理搜索推荐语音技术

大模型技术的分化与应用

【1月更文挑战第14天】大模型技术的分化与应用

楠竹11

98 2 2

ModelScope模型即服务

热门文章

最新文章

阿里云通义千问向全社会开放！

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

multi-agent：多角色Agent协同合作，高效完成复杂任务

vanna+qwen实现私有模型的SQL转换

自然语言处理Transformer模型最详细讲解（图解版）

通义千问72B、1.8B、Audio模型开源！魔搭社区最佳实践来啦！

ModelScope一键部署模型：新手村实操FAQ篇

【RAG实践】Rerank，让RAG更近一步

大模型时代，还缺一只雨燕｜ SWIFT：魔搭社区轻量级微调推理框架

Java“TimeoutException”解决

Google提出的网页性能评价指标

响应时间指标的探索

Jacoco的XML报告详解

虚拟化技术：实现资源高效利用和灵活管理的利器

Java“NoSuchElementException”问题解决

魔搭案例开源获奖

如何驱逐某个节点上到某些名称空间的pod到其他节点

低功耗蓝牙

相关课程

更多

人人都能学｜AI大模型应用搭建

人机对话技术浅析

云原生AI套件：五分钟微调宝可梦风格StableDiffusion

机器学习集成学习与模型融合

AliPG的独特能力

视觉AI技术体系及趋势概述

相关电子书

更多

大规模稀疏化模型技术介绍及实践

强化学习在电商环境下的若干应用与研究

基于实时深度学习的推荐系统架构设计和技术演进

相关实验场景

更多

【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板

使用PAI+LLaMA Factory微调Qwen2-VL模型，搭建文旅领域知识问答机器人

SAE 极速部署专属 AI 证件照神器

流水线运行出错排查难？AI帮你智能排查

以电商场景为例搭建AI语义搜索应用

AI克隆声音，基于函数计算部署GPT-Sovits语音生成模型

下一篇

阿里云OSS设置跨域访问