产品
解决方案
文档与社区
权益中心
定价
云市场
合作伙伴
支持与服务
了解阿里云
AI 助理
备案
控制台
开发者社区
首页
计算机视觉
自然语言处理
语音
多模态
科学计算
魔搭社区官网
探索云世界
新手上云
云上应用构建
云上数据管理
云上探索人工智能
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
热门
百炼大模型
Modelscope模型即服务
弹性计算
云原生
数据库
云效DevOps
龙蜥操作系统
平头哥
钉钉开放平台
物联网
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
支持服务
镜像站
码上公益
开发者社区
>
ModelScope模型即服务
>
多模态
>
视频
>
正文
ONE-PEACE:探索通往无限模态的通用表征模型
发布者:
Dev-Talk
2023-06-14 19:06:27
2680
Dev-Talk
+关注
视频介绍
王鹏 达摩院高级算法工程师
相关视频
6分53秒
AI 求职季,通义灵码助你备战技术面试
阿里云云原生
304播放
99分15秒
职场 landing 干货:通义灵码实战分享局
81405播放
65分11秒
AI求职季|程序员坦白局,AI时代的职业选择与未来
Dev-Talk
68141播放
1分18秒
通义灵码高效编程实践营——云工开物高校训练营西安站开营仪式
阿里云云原生
370播放
65分38秒
大学生如何用通义灵码解锁高效编程学习与实战
Dev-Talk
288播放
7分2秒
通义灵码入职阿里云,看看新同事灵不灵?
阿里云云原生
384播放
0分25秒
首个 AI 程序员通义灵码入职阿里云,未来20%的代码由它编写
阿里云云原生
420播放
22分58秒
阿里云智能编码助手通义灵码详解
Dev-Talk
492播放
8分47秒
AI 编码达人养成计划:用通义灵码完成3大高校场景体验
通义灵码
6427播放
8分47秒
利用通义灵码基于Java+Spring+MVC开发用户注册登录网站
Dev-Talk
640播放
ModelScope模型即服务
多模态
+关注
包含图像描述、文本生成图片、版面分析、多模态表征、视觉问答、文档理解等多个领域
热门文章
热门讨论
POINTS 1.5:腾讯微信开源的多模态大模型,超越了业界其他的开源视觉语言模型,具备强大的视觉和语言处理能力
109
Gemini 2.0:谷歌推出的原生多模态输入输出 + Agent 为核心的 AI 模型
84
Insight-V:腾讯联合南洋理工、清华大学推出提升长链视觉推理能力的多模态模型
70
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
69
Megrez-3B-Omni:无问芯穹开源最强端侧全模态模型,支持理解图像、音频和文本三种模态数据
50
DiffSensei:AI 漫画生成框架,能生成内容可控的黑白漫画面板,支持多角色和布局控制
49
Lyra:SmartMore 联合香港多所高校推出的多模态大型语言模型,专注于提升语音、视觉和语言模态的交互能力
47
Ultravox:端到端多模态大模型,能直接理解文本和语音内容,无需依赖语音识别
43
MMAudio:开源 AI 音频合成项目,根据视频或文本生成同步的音频
42
Maya:基于 LLaVA 开发的多模态小模型,能理解和处理八种语言,适用于低资源环境
42
展开全部
请问Qwen-VL怎么用自己的数据集微调
1274
为什么用vllm部署qwen2-2b-vl,传输2张照片却,只回答一张照片的问题?
175
在4卡4090(24G)服务器上利用modelscope离线部署Qwen2vl-Flux时报错
11
怎么修改model scope的默认存储位置
207
文本到图像生成扩散模型-中英文-通用领域-tiny 报错
1515
modelscope版本1.2.1运行stable diffusion中文通用报错
1512
图文匹配:Clip模型介绍
1023
代码问题关于videofusion
200
18领域的文本分类模型在什么场景使用呢?
1683
中文StableDiffusion-通用领域,报错
1904
展开全部
+关注
Dev-Talk
文章
问答
视频
相关文章
更多
有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
docker基本命令学习 | Docker网络、Docker镜像发布
【网络编程】第2章(3) 客户软件的设计算法和实现技术
【Docker】Docker中network的概要、常用命令、网络模式以及底层ip和容器映射变化的详细讲解
(服务器&客户端)网络通信是怎么实现的?7000字爆肝----原来java网络编程技术功不可没(多线程,URL,InetAddressm,TCP,UDP)集结
《云原生网络数据面可观测性最佳实践》——二、全景剖析阿里云容器网络数据链路——6. ASM Istio 模式架构设计(上)
《云原生网络数据面可观测性最佳实践》——二、全景剖析阿里云容器网络数据链路——6. ASM Istio 模式架构设计(中)
《云原生网络数据面可观测性最佳实践》——二、全景剖析阿里云容器网络数据链路——6. ASM Istio 模式架构设计(下)
巧用千寻位置GNSS软件|CAD功能全解析
《Cisco IPv6网络实现技术(修订版)》一2.4 在Cisco IOS软件技术上配置IPv6