产品
解决方案
文档与社区
权益中心
定价
云市场
合作伙伴
支持与服务
了解阿里云
AI 助理
备案
控制台
开发者社区
首页
计算机视觉
自然语言处理
语音
多模态
科学计算
魔搭社区官网
探索云世界
新手上云
云上应用构建
云上数据管理
云上探索人工智能
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
热门
百炼大模型
Modelscope模型即服务
弹性计算
云原生
数据库
云效DevOps
龙蜥操作系统
平头哥
钉钉开放平台
物联网
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
支持服务
镜像站
码上公益
开发者社区
>
ModelScope模型即服务
>
多模态
>
正文
ofa有没有多语言的版本?
已解决
ofa有没有多语言的版本?
展开
收起
OFA视觉问答模型-英文-通用领域-huge
叫我饭啊啊
2023-02-24 09:42:41
586
0
1
条回答
写回答
取消
提交回答
大口吃饭饭啊
推荐回答
暂时还没有multi-lingual的的版本哈,目前是单独分开了中文和英文。
2023-02-24 10:32:05
赞同
展开评论
打赏
相关问答
多模态
this xml file does not appear to have any style in
32843
8
0
如果购买了域名,一定要备案才能用吗
37569
36
0
OSS的endpoint如何查看
30162
3
0
域名在腾讯云备案成功,解析到阿里云服务器,提示仍需备案?
56330
30
0
有哪些值得收藏的五个种子搜索引擎&磁力搜索引擎?
94119
16
0
com/action/joingroup?code=v1是什么意思
206670
20
0
配置了安全组规则,端口还是无法访问
27792
21
0
支付宝H5 下载的时候,提示 【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】
231705
10
0
购买阿里国外的云服务器是否可以访问谷歌?
75958
46
0
阿里云服务器如何重置系统?
21794
4
0
ModelScope模型即服务
多模态
包含图像描述、文本生成图片、版面分析、多模态表征、视觉问答、文档理解等多个领域
我要提问
热门讨论
热门文章
为什么用vllm部署qwen2-2b-vl,传输2张照片却,只回答一张照片的问题?
220
请问Qwen-VL怎么用自己的数据集微调
1307
怎么修改model scope的默认存储位置
225
【求助】关于使用Qwen2-7B-VL多模型模型识别图片某个元素的坐标的问题
85
图文匹配:Clip模型介绍
1032
有人遇到吗?modelscope:cuda is not available, using cpu
1038
在4卡4090(24G)服务器上利用modelscope离线部署Qwen2vl-Flux时报错
33
多模态热门的模型有哪一些?
1852
当下载大模型时,出现过慢的情况,有什么更好的方式解决
3859
在VQA任务里,有办法区分context和question吗?
587
展开全部
LongDocURL:中科院联合阿里推出多模态长文档理解基准数据集,用于评估模型对复杂文档分析与推理的能力
106
WeaveFox:蚂蚁集团推出 AI 前端智能研发平台,能够根据设计图直接生成源代码,支持多种客户端和技术栈
453
行业实践 | 基于Qwen2-VL实现医疗表单结构化输出
74
Browser Use:开源 AI 浏览器助手,自动完成网页交互任务,支持多标签页管理、视觉识别和内容提取等功能
146
StockMixer:上海交大推出预测股票价格的 MLP 架构,通过捕捉指标、时间和股票间的复杂相关性,预测下一个交易日的收盘价
57
EDTalk:只需上传图片、音频和视频,就能使图片中的人物说话,情感表情与音频情绪高度统一
52
FinRobot:开源的金融专业 AI Agent,提供市场预测、报告分析和交易策略等金融解决方案
49
Vision Parse:开源的 PDF 转 Markdown 工具,结合视觉语言模型和 OCR,识别文本和表格并保持原格式
44
PC Agent:开源 AI 电脑智能体,自动收集人机交互数据,模拟认知过程实现办公自动化
84
Midscene.js:AI 驱动的 UI 自动化测试框架,支持自然语言交互,生成可视化报告
103
展开全部
相关文章
MMedAgent:专为医疗领域设计的多模态 AI 智能体,支持医学影像处理、报告生成等多种医疗任务
Jina Reader:一键将网页内容转为适合 LLM 处理的文本格式,自动抓取和清洗网页内容,支持多种输出格式
人工智能在事件管理中的应用
《量子机器学习:构建量子版神经网络模型》
VITRON:开源像素级视觉大模型,同时满足图像与视频理解、生成、分割和编辑等视觉任务
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载