SkyReels-V1:短剧AI革命来了!昆仑开源视频生成AI秒出影视级短剧,比Sora更懂表演!

简介: SkyReels-V1是昆仑万维开源的首个面向AI短剧创作的视频生成模型,支持高质量影视级视频生成、33种细腻表情和400多种自然动作组合。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦


🎥 "短剧团队今夜无眠!昆仑万维开源影视级AI:33种微表情精准控制,400动作组合秒出片"

大家好,我是蚝油菜花。当同行还在为演员档期发愁时,前沿团队已经用AI批量生产短剧了!

传统短剧制作三大痛点:

  • 🚫 专业演员日薪过万,微表情NG20次是常态
  • 🚫 复杂动作戏需要武指+替身,成本几何级暴涨
  • 🚫 后期渲染动辄数小时,创意在等待中消磨殆尽...

今天揭秘的 SkyReels-V1 ,正在掀起影视创作革命!这个由昆仑万维开源的首个AI短剧生成模型:

  • ✅ 基于千万级好莱坞影像训练,输出电影级光影质感
  • ✅ 精准控制33种微表情与400+动作组合,连手指颤动都自然
  • ✅ 自研推理框架加持,3090显卡就能跑4K视频

已有团队用它日更10集短剧,接下来我们将实测:如何用AI把剧本直接变影视成片!

🚀 快速阅读

SkyReels-V1 是昆仑万维开源的首个面向AI短剧创作的视频生成模型,基于千万级高质量影视数据进行微调。

  1. 核心功能:支持高质量影视级视频生成、33种细腻表情和400多种自然动作组合。
  2. 技术原理:采用自研推理框架SkyReels-Infer,大幅提升推理效率,支持多GPU并行和低显存优化。

SkyReels-V1 是什么

SkyReels-V1

SkyReels-V1 是昆仑万维开源的首个面向AI短剧创作的视频生成模型。该模型基于在千万级高质量影视数据上进行微调,实现影视级的人物微表情和肢体动作生成,支持33种细腻表情与400多种自然动作组合,高度还原真实情感表达。模型支持文生视频(Text-to-Video)和图生视频(Image-to-Video),在开源视频生成模型中达到SOTA水平。

SkyReels-V1 基于自研推理框架SkyReels-Infer,大幅提升了推理效率,支持多GPU并行和低显存优化,能够在消费级显卡上高效生成高质量视频。通过这些技术,SkyReels-V1 为AI短剧创作提供了强大的工具,简化了视频制作流程,提升了效率。

SkyReels-V1 的主要功能

  • 高质量影视级视频生成:支持生成具有电影级光影效果、细腻人物表情和自然肢体动作的视频内容。每一帧画面在构图、演员站位和相机角度上都具备高质量的影视质感。
  • 表情和动作的精细控制:支持33种细腻的人物表情和400多种自然动作组合,能够生成大笑、怒吼、惊讶、哭泣等微表情。
  • 文生视频与图生视频:支持Text-to-Video(文生视频)和Image-to-Video(图生视频)两种生成方式。
  • 多场景支持:支持处理单人镜头和多人构图,适用于复杂的场景和情感表达。

SkyReels-V1 的技术原理

  • 自研数据清洗与标注管线:使用高质量的影视数据(如好莱坞电影、电视剧等)进行训练,基于自研数据清洗和标注管线,对人物表情、动作、场景等进行精细化标注,提升模型对人类表演的理解能力。
  • 多阶段预训练与微调
    • 阶段1:模型域适应预训练,将基础模型适配到人类中心视频领域。
    • 阶段2:将文本到视频模型转换为图像到视频模型,在相同数据集上进行预训练。
    • 阶段3:在高质量子集上进行微调,确保模型在复杂视频生成任务中的高性能。
  • 多模态理解与生成:结合人物表情、动作、场景和剧情的多模态理解,构建行为语义单元和人物空间位置感知技术,实现精准的人物表演生成。
  • 高效的推理优化:采用FP8量化、参数级卸载(offload)和优化的注意力机制(如SageAttn),大幅降低显存占用并提升推理速度。支持多GPU并行推理,基于分布式计算进一步提高生成效率。

如何运行 SkyReels-V1

1. 克隆仓库

git clone https://github.com/SkyworkAI/SkyReels-V1
cd skyreelsinfer

2. 安装依赖

推荐使用CUDA 12.2版本进行手动安装。

pip install -r requirements.txt

当有足够的VRAM时(例如A800),可以直接运行无损版本。

3. 生成视频示例

SkyReelsModel = "Skywork/SkyReels-V1-Hunyuan-T2V"
python3 video_generate.py \
    --model_id ${SkyReelsModel} \
    --task_type t2v \
    --guidance_scale 6.0 \
    --height 544 \
    --width 960 \
    --num_frames 97 \
    --prompt "FPS-24, A cat wearing sunglasses and working as a lifeguard at a pool" \
    --embedded_guidance_scale 1.0

4. 使用 FP8 量化和 offload 优化

python3 video_generate.py \
    --model_id ${SkyReelsModel} \
    --task_type t2v \
    --guidance_scale 6.0 \
    --height 544 \
    --width 960 \
    --num_frames 97 \
    --prompt "FPS-24, A cat wearing sunglasses and working as a lifeguard at a pool" \
    --embedded_guidance_scale 1.0 \
    --quant \
    --offload \
    --high_cpu_memory \
    --parameters_level

5. 多GPU并行推理

python3 video_generate.py \
    --model_id ${SkyReelsModel} \
    --guidance_scale 6.0 \
    --height 544 \
    --width 960 \
    --num_frames 97 \
    --prompt "FPS-24, A cat wearing sunglasses and working as a lifeguard at a pool" \
    --embedded_guidance_scale 1.0 \
    --quant \
    --offload \
    --high_cpu_memory \
    --gpu_num $GPU_NUM

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦

相关文章
|
4月前
|
人工智能 中间件 数据库
沐曦 GPU 融入龙蜥,共筑开源 AI 基础设施新底座
沐曦自加入社区以来,一直与龙蜥社区在推动 AIDC OS 的开源社区建设等方面保持合作。
|
4月前
|
人工智能 API 数据安全/隐私保护
近期非常风靡非常逼真的AI视频内容由sora生成的视频是怎么回事?-优雅草卓伊凡
近期非常风靡非常逼真的AI视频内容由sora生成的视频是怎么回事?-优雅草卓伊凡
1004 12
近期非常风靡非常逼真的AI视频内容由sora生成的视频是怎么回事?-优雅草卓伊凡
|
4月前
|
人工智能 运维 Java
Spring AI Alibaba Admin 开源!以数据为中心的 Agent 开发平台
Spring AI Alibaba Admin 正式发布!一站式实现 Prompt 管理、动态热更新、评测集构建、自动化评估与全链路可观测,助力企业高效构建可信赖的 AI Agent 应用。开源共建,现已上线!
5490 78
|
5月前
|
人工智能 运维 安全
|
4月前
|
人工智能 自然语言处理 安全
从工具到伙伴:AI代理(Agent)是下一场革命
从工具到伙伴:AI代理(Agent)是下一场革命
443 117
|
4月前
|
人工智能 自然语言处理 Shell
我们开源了一款 AI 驱动的用户社区
KoalaQA 是一款开源的 AI 驱动用户社区,支持智能问答、语义搜索、自动运营与辅助创作,助力企业降低客服成本,提升响应效率与用户体验。一键部署,灵活接入大模型,快速构建专属售后服务社区。
436 5
我们开源了一款 AI 驱动的用户社区
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
836 13
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
|
4月前
|
人工智能 文字识别 自然语言处理
从“看见”到“预见”:合合信息“多模态文本智能技术”如何引爆AI下一场革命。
近期,在第八届中国模式识别与计算机视觉学术会议(PRCV 2025)上,合合信息作为承办方举办了“多模态文本智能大模型前沿技术与应用”论坛,汇聚了学术界的顶尖智慧,更抛出了一颗重磅“炸弹”——“多模态文本智能技术”概念。
240 1
|
4月前
|
人工智能 搜索推荐 UED
一个牛逼的国产AI自动化工具,开源了 !
AiPy是国产开源AI工具,结合大语言模型与Python,支持本地部署。用户只需用自然语言描述需求,即可自动生成并执行代码,轻松实现数据分析、清洗、可视化等任务,零基础也能玩转编程,被誉为程序员的智能助手。

热门文章

最新文章