产品
解决方案
文档与社区
权益中心
定价
云市场
合作伙伴
支持与服务
了解阿里云
AI 助理
备案
控制台
开发者社区
首页
计算机视觉
自然语言处理
语音
多模态
科学计算
魔搭社区官网
探索云世界
新手上云
云上应用构建
云上数据管理
云上探索人工智能
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
热门
百炼大模型
Modelscope模型即服务
弹性计算
云原生
数据库
云效DevOps
龙蜥操作系统
平头哥
钉钉开放平台
物联网
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
支持服务
镜像站
码上公益
开发者社区
>
ModelScope模型即服务
>
多模态
>
正文
找不到模型啊 是不是模型地址改了
找不到模型啊 是不是模型地址改了
展开
收起
GridVLP多模态类目预测-中文-电商领域-large
xqd915
2023-04-07 17:38:52
223
0
1
条回答
写回答
取消
提交回答
通义小二
有什么提示信息吗?
2023-05-10 17:43:22
赞同
展开评论
打赏
相关问答
多模态
this xml file does not appear to have any style in
32564
8
0
如果购买了域名,一定要备案才能用吗
37487
36
0
OSS的endpoint如何查看
30114
3
0
域名在腾讯云备案成功,解析到阿里云服务器,提示仍需备案?
56295
30
0
有哪些值得收藏的五个种子搜索引擎&磁力搜索引擎?
94026
16
0
com/action/joingroup?code=v1是什么意思
206545
20
0
配置了安全组规则,端口还是无法访问
27762
21
0
支付宝H5 下载的时候,提示 【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】
231440
10
0
购买阿里国外的云服务器是否可以访问谷歌?
75920
46
0
java的官网网址是什么
30165
22
0
ModelScope模型即服务
多模态
包含图像描述、文本生成图片、版面分析、多模态表征、视觉问答、文档理解等多个领域
我要提问
热门讨论
热门文章
为什么用vllm部署qwen2-2b-vl,传输2张照片却,只回答一张照片的问题?
213
请问Qwen-VL怎么用自己的数据集微调
1304
有人遇到吗?modelscope:cuda is not available, using cpu
1037
【求助】关于使用Qwen2-7B-VL多模型模型识别图片某个元素的坐标的问题
84
怎么修改model scope的默认存储位置
221
多模态热门的模型有哪一些?
1851
当下载大模型时,出现过慢的情况,有什么更好的方式解决
3858
modelscope版本1.2.1运行stable diffusion中文通用报错
1523
图文匹配:Clip模型介绍
1031
OFA文生图模型,显存空间不足的问题如何解决
1744
展开全部
WeaveFox:蚂蚁集团推出 AI 前端智能研发平台,能够根据设计图直接生成源代码,支持多种客户端和技术栈
429
Browser Use:开源 AI 浏览器助手,自动完成网页交互任务,支持多标签页管理、视觉识别和内容提取等功能
121
Midscene.js:AI 驱动的 UI 自动化测试框架,支持自然语言交互,生成可视化报告
90
行业实践 | 基于Qwen2-VL实现医疗表单结构化输出
63
PC Agent:开源 AI 电脑智能体,自动收集人机交互数据,模拟认知过程实现办公自动化
70
EDTalk:只需上传图片、音频和视频,就能使图片中的人物说话,情感表情与音频情绪高度统一
46
AgentScope:阿里开源多智能体低代码开发平台,支持一键导出源码、多种模型API和本地模型部署
96
Open Notebook:开源 AI 笔记工具,支持多种文件格式,自动转播客和生成总结,集成搜索引擎等功能
60
FinRobot:开源的金融专业 AI Agent,提供市场预测、报告分析和交易策略等金融解决方案
38
OmniSearch:阿里巴巴通义推出的多模态检索增强生成框架
238
展开全部
相关文章
EDTalk:只需上传图片、音频和视频,就能使图片中的人物说话,情感表情与音频情绪高度统一
AGUVIS:指导模型实现 GUI 自动化训练框架,结合视觉-语言模型进行训练,实现跨平台自主 GUI 交互
GraphAgent:自动构建知识图谱,能够处理结构化和非结构化数据,并通过知识图谱展示复杂关系
Large Motion Model:多模态运动生成模型,能够同时处理文本、音乐、视频等多种模态生成相应的运动动作
Valley:字节跳动开源小体积的多模态模型,在小于 10B 参数的模型中排名第二
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载