备案控制台

开发者社区 ModelScope模型即服务多模态正文

text2video模型生成视频只有2s钟

为何生成的视频只有2s，能指定时间嘛

展开

收起

文本生成视频大模型-英文-通用领域

1634116198694012 2023-03-22 19:18:30 1722 版权

1 条回答

写回答

取消提交回答

游客vhp23wg6dj2xw

你要知道，一秒目前大概是16帧左右，两秒就要生成32张图片。猜测训练的时候由于计算机计算资源的限制，训练场景可能就是2s左右。不过目前有其他方案利用自回归的能力，不断输入下一个Prompt来生成一个story的视频，可达2min

2023-03-28 11:20:19

赞同 1 展开评论

相关问答

请问下我访问接口不通什么原因 Provisional headers are shown

3278

0

0

购买阿里国外的云服务器是否可以访问谷歌？

82893

47

0

sql server的用户名和密码怎么查啊？

37078

21

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60610

30

0

this xml file does not appear to have any style in

51254

10

0

OSS的endpoint如何查看

37227

6

0

通过www和不带www的网址输入最终都指向www.我的域名.com，求指教

132403

28

0

配置了安全组规则，端口还是无法访问

33143

25

0

域名在阿里买的，服务器在百度买的，域名备案在百度云也通过备案了，现在怎么将阿里云的域名解析到百度

3308

1

0

java并且符号怎么按出来

3037

1

0

ModelScope模型即服务

多模态

包含图像描述、文本生成图片、版面分析、多模态表征、视觉问答、文档理解等多个领域

我要提问

相关文章

机器人训练师狂喜！Infinite Mobility：上海AI Lab造物神器1秒生成可动家具，成本只要1分钱

AI生成视频告别剪辑拼接！MAGI-1：开源自回归视频生成模型，支持一镜到底的长视频生成

开源8B参数全能扩散模型Flex.2-preview：把线稿变商稿，还能边画边改！

RAGEN：RL训练LLM推理新范式！开源强化学习框架让Agent学会多轮决策

大模型基本概念介绍

热门讨论

热门文章

通过ollama 编写modelfile的形式创建翻译模型，输出全是思考，老是超限，翻译不出来。

怎么修改model scope的默认存储位置

为什么用vllm部署qwen2-2b-vl，传输2张照片却，只回答一张照片的问题？

modelscope中“mPLUG-HiTeA模型”使用报错求助是什么原因

如何本地化（局域网内）部署Qwen的多模态大模型，用作推理并自有程序调用

3D-Speaker怎么使用自己的声纹音频文件进行训练，研究好久了，一直没有思路

请问Qwen-VL怎么用自己的数据集微调

当下载大模型时，出现过慢的情况，有什么更好的方式解决

!pip install open_clip_torch !pip install pytorch-

下载数据集报错：UnicodeDecodeError: 'utf-8' codec can't de

展开全部

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

AstrBot：轻松将大模型接入QQ、微信等消息平台，打造多功能AI聊天机器人的开发框架，附详细教程

AnythingLLM：34K Star！一键上传文件轻松打造个人知识库，构建只属于你的AI助手，附详细部署教程

GLM-4V-Flash：智谱 AI 免费开放的图像理解大模型 API 接口

Agno：18.7K Star！快速构建多模态智能体的轻量级框架，运行速度比LangGraph快5000倍！

Mobile-Agent：通过视觉感知实现自动化手机操作，支持多应用跨平台

阿里开源AI视频生成大模型 Wan2.1：14B性能超越Sora、Luma等模型，一键生成复杂运动视频

音乐人必看！OpenUtau：开源AI歌声合成神器，快速打造专业级虚拟歌手，中文日文无缝切换

VideoCaptioner：北大推出视频字幕处理神器，AI自动生成+断句+翻译，1小时工作量5分钟搞定

展开全部

还有其他疑问?