CogVideoX-Flash：智谱首个免费AI视频生成模型，支持文生视频、图生视频，分辨率最高可达4K

2025-01-21 1898

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： CogVideoX-Flash 是智谱推出的首个免费AI视频生成模型，支持文生视频、图生视频，最高支持4K分辨率，广泛应用于内容创作、教育、广告等领域。

❤️ 如果你也关注 AI 的发展现状，且对 AI 应用开发非常感兴趣，我会每日分享大模型与 AI 领域的最新开源项目和应用，提供运行实例和实用教程，帮助你快速上手AI技术，欢迎关注我哦！

🥦 微信公众号｜搜一搜：蚝油菜花 🥦

🚀 快速阅读

正文（附运行示例）

CogVideoX-Flash

CogVideoX-Flash 是智谱推出的首个免费AI视频生成模型，继承了CogVideoX自研的端到端视频理解模型，具备强大的视频生成能力。该模型支持文生视频，能够根据输入的文本描述精准生成相应的动态视频内容。

此外，CogVideoX-Flash 还支持图生视频，能够对输入的图片进行深度解析，提取图片中的关键信息、元素特征及潜在语义，为视频增添听觉享受。CogVideoX-Flash 广泛应用于多种场景，为用户带来视觉与听觉的双重盛宴。

文本到视频（Text-to-Video）：根据用户输入的详细文本描述，生成与之匹配的动态视频内容。
图像到视频（Image-to-Video）：对输入的静态图片进行深度解析，提取图片中的关键信息、元素特征及潜在语义。
高分辨率支持：支持多种分辨率，最高可达 4K（3840×2160），包括 720×480、1024×1024、1280×960、960×1280、1920×1080、1080×1920、2048×1080 等。
长视频时长：支持长达 10 秒的视频时长，满足更多场景需求。
高帧率：支持高达 60fps 的帧率，显著提升视频的流畅度。
AI 音效：为生成的视频添加匹配的音效，增强视频的视觉冲击力和听觉体验。

🥦 微信公众号｜搜一搜：蚝油菜花 🥦