文档备案控制台

开发者社区 ModelScope模型即服务多模态正文

多模态模型的发展趋势：迄今为止最先进的模型，跨模态 GAN，多模态 Transformer

多模态模型是迄今为止最先进的，因为它们可以接受多种不同的输入方式(例如语言、图像、语音、视频) ，并且在某些情况下产生不同的输出模态。

展开

收起

ModelScope运营小助手 2022-10-29 11:09:12 2314 版权

1 条回答

写回答

取消提交回答

ModelScope多模态小助手

推荐一篇论文，感兴趣可以看看 Vision-Language Pre-training: Basics, Recent Advances, and Future Trends 地址：https://arxiv.org/pdf/2210.09263v1.pdf

2022-11-04 10:22:24

赞同展开评论

相关问答

如果使用模型qwen-turbo改怎么修改改语句？

272

1

0

怎么使用vllm部署最新的qwen3的mbedding 和reranker模型呢

1160

0

0

百炼平台使用qwen-plus和qwen-max模型超时

1025

2

0

qwen-plus模型回答问题不对，有两个数9.9和9.11谁大。a:9.9,b:9.11，直接回答

307

1

0

请问如何在微软的Autogen 0.4框架下使用Qwen模型实现工具调用？

1177

1

0

使用qwen-mt-turbo模型的openapi限流如何解除

1408

0

0

qwen模型微调上传数据集时，如何书写数据集的本地路径？

402

0

0

vscode集成通义灵码后，使用deepseek模型，会经常遇到连接超时的情况

662

2

0

Unichat - qwen2.5 - 32B - c1 模型已经下载下来在运行python报错

364

1

0

魔搭平台FastChat搭建Qwen-1_8B模型报错怎么解决？

388

1

0

ModelScope模型即服务

多模态

包含图像描述、文本生成图片、版面分析、多模态表征、视觉问答、文档理解等多个领域

我要提问

收录在圈子:

多模态模型

176

+ 订阅

相关文章

周一上线｜OpenAI 开卖 Agent 指挥台，DeepSeek 被曝筹备 IPO，开放模型迈入 3T 时代

跨境选品秘籍：API如何帮你分析全球价格差？

【剪映小助手】特效信息生成接口（Effect Infos）

番茄病害目标检测数据集：9类别、5,000张图像 | 目标检测

27类餐厨垃圾4100张YOLO垃圾分类数据集分享

相关解决方案

更多

多模态数据信息提取

GLM-5.2：长任务时代开源旗舰模型

基于 Spark 和 PyTorch 的模型训练方案

OpenAI 重磅开源，快速部署GPT-OSS模型

模型蒸馏：让0.6B模型媲美235B模型

热门讨论

热门文章

怎么修改model scope的默认存储位置

为什么用vllm部署qwen2-2b-vl，传输2张照片却，只回答一张照片的问题？

图文匹配：Clip模型介绍

modelscope模型部署到PAI EAS上调试报错

【求助】关于使用Qwen2-7B-VL多模型模型识别图片某个元素的坐标的问题

35张图，直观理解Stable Diffusion

3D-Speaker怎么使用自己的声纹音频文件进行训练，研究好久了，一直没有思路

多模态模型的发展趋势：迄今为止最先进的模型，跨模态 GAN，多模态 Transformer

!pip install open_clip_torch !pip install pytorch-

ofa_image-caption 支持中文训练吗？

展开全部

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

GLM-4V-Flash：智谱 AI 免费开放的图像理解大模型 API 接口

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

阿里开源AI视频生成大模型 Wan2.1：14B性能超越Sora、Luma等模型，一键生成复杂运动视频

Open-LLM-VTuber：宅男福音！开源AI老婆离线版上线，实时语音+Live2D互动还会脸红心跳

音乐人必看！OpenUtau：开源AI歌声合成神器，快速打造专业级虚拟歌手，中文日文无缝切换

Heygem：开源数字人克隆神器！1秒视频生成4K超高清AI形象，1080Ti显卡也能轻松跑

AnythingLLM：34K Star！一键上传文件轻松打造个人知识库，构建只属于你的AI助手，附详细部署教程

AstrBot：轻松将大模型接入QQ、微信等消息平台，打造多功能AI聊天机器人的开发框架，附详细教程

推荐一款可以简单快速部署开源AI模型的桌面软件 Doo AI

展开全部

还有其他疑问?