52个AIGC视频生成算法模型介绍(中)

简介: 52个AIGC视频生成算法模型介绍(中)

52个AIGC视频生成算法模型介绍(上):https://developer.aliyun.com/article/1480690


  • Pix2Video: Video Editing using Image Diffusion


机构:Abode

时间:2023.3.22

https://duyguceylan.github.io/pix2video.github.io/


  • InstructVid2Vid: Controllable Video Editing with Natural Language Instructions


机构:浙大

时间:2023.5.21


  • ControlVideo: Training-free Controllable Text-to-Video Generation


机构:华为

时间:2023.5.22

https://github.com/YBYBZhang/ControlVideo


  • ControlVideo: Conditional Control for One-shot Text-driven Video Editing and Beyond


机构:清华

时间:2023.11.28

https://github.com/thu-ml/controlvideo


  • Control-A-Video: Controllable Text-to-Video Generation with Diffusion Models


时间:2023.12.6https://controlavideo.github.io/


  • StableVideo: Text-driven Consistency-aware Diffusion Video Editing


机构:MSRA

时间:2023.8.18

https://github.com/rese1f/StableVideo


  • MagicEdit: High-Fidelity and Temporally Coherent Video Editing


机构:字节

时间:2023.8.28

https://magic-edit.github.io/(未开源)


  • GROUND-A-VIDEO: ZERO-SHOT GROUNDED VIDEO EDITING USING TEXT-TO-IMAGE DIFFUSION MODELS


机构:KAIST时间:2023.10.2https://ground-a-video.github.io/

  • FateZero: Fusing Attentions for Zero-shot Text-based Video Editing


机构:腾讯AI Lab时间:2023.10.11

https://fate-zero-edit.github.io


  • Motion-Conditioned Image Animation for Video Editing


机构:Meta

时间:2023.11.30

facebookresearch.github.io/MoCA(未开源)


  • VidEdit: Zero-shot and Spatially Aware Text-driven Video Editing


机构:Sorbonne Université, Paris, France

时间:2023.12.15

https://videdit.github.io


  • Zero-Shot Video Editing Using Off-The-Shelf Image Diffusion Models


时间:2024.1.4https://github.com/baaivision/vid2vid-zero

 人物动态化



主要是通过人体姿态作为条件性输入(结合controlnet等),将一张图作为前置参考图,或者直接使用文本描述生成图片。其中阿里和字节分别有几篇代表性论文,其中字节的代码有两篇已经开源,阿里的代码还在等待阶段。


  • Follow Your Pose


机构:腾讯AI Lab

时间:2023.4.3

https://follow-your-pose.github.io/

  • DreamPose: Fashion Image-to-Video Synthesis via Stable Diffusion


机构:google,nvidia

时间:2023.5.4

https://grail.cs.washington.edu/projects/dreampose/


  • DISCO: Disentangled Control for Realistic Human Dance Generation


机构:微软

时间:2023.10.11

https://disco-dance.github.io


  • MagicAnimate: Temporally Consistent Human Image Animation using Diffusion Model


机构:字节

时间:2023.11.27

https://showlab.github.io/magicanimate/


  • MaigcDance


机构:字节

时间:2023.11.18

https://boese0601.github.io/magicdance/


  • Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation


机构:阿里

时间:2023.12.7

https://humanaigc.github.io/animate-anyone/(未开源)

  • DreaMoving: A Human Video Generation Framework based on Diffusion Model


机构:阿里

时间:2023.12.11

https://dreamoving.github.io/dreamoving(未开源)

52个AIGC视频生成算法模型介绍(下):https://developer.aliyun.com/article/1480687

目录
相关文章
|
14天前
|
机器学习/深度学习 算法
扩散模型=进化算法!生物学大佬用数学揭示本质
在机器学习与生物学交叉领域,Tufts和Harvard大学研究人员揭示了扩散模型与进化算法的深刻联系。研究表明,扩散模型本质上是一种进化算法,通过逐步去噪生成数据点,类似于进化中的变异和选择机制。这一发现不仅在理论上具有重要意义,还提出了扩散进化方法,能够高效识别多解、处理高维复杂参数空间,并显著减少计算步骤,为图像生成、视频合成及神经网络优化等应用带来广泛潜力。论文地址:https://arxiv.org/pdf/2410.02543。
37 21
|
20天前
|
人工智能 算法 搜索推荐
单纯接入第三方模型就无需算法备案了么?
随着人工智能的发展,企业接入第三方模型提升业务能力的现象日益普遍,但算法备案问题引发诸多讨论。根据相关法规,无论使用自研或第三方模型,只要涉及向中国境内公众提供算法推荐服务,企业均需履行备案义务。这不仅因为服务性质未变,风险依然存在,也符合监管要求。备案内容涵盖模型基本信息、算法优化目标等,且需动态管理。未备案可能面临法律和运营风险。建议企业提前规划、合规管理和积极沟通,确保合法合规运营。
|
1月前
|
机器学习/深度学习 人工智能 算法
机器学习算法的优化与改进:提升模型性能的策略与方法
机器学习算法的优化与改进:提升模型性能的策略与方法
340 13
机器学习算法的优化与改进:提升模型性能的策略与方法
|
2月前
|
机器学习/深度学习 人工智能 算法
Enhance-A-Video:上海 AI Lab 推出视频生成质量增强算法,显著提升 AI 视频生成的真实度和细节表现
Enhance-A-Video 是由上海人工智能实验室、新加坡国立大学和德克萨斯大学奥斯汀分校联合推出的视频生成质量增强算法,能够显著提升视频的对比度、清晰度和细节真实性。
127 8
Enhance-A-Video:上海 AI Lab 推出视频生成质量增强算法,显著提升 AI 视频生成的真实度和细节表现
|
2月前
|
算法
基于模糊PI控制算法的龙格库塔CSTR模型控制系统simulink建模与仿真
本项目基于MATLAB2022a,采用模糊PI控制算法结合龙格-库塔方法,对CSTR模型进行Simulink建模与仿真。通过模糊控制处理误差及变化率,实现精确控制。核心在于将模糊逻辑与经典数值方法融合,提升系统性能。
|
2月前
|
存储 算法
基于HMM隐马尔可夫模型的金融数据预测算法matlab仿真
本项目基于HMM模型实现金融数据预测,包括模型训练与预测两部分。在MATLAB2022A上运行,通过计算状态转移和观测概率预测未来值,并绘制了预测值、真实值及预测误差的对比图。HMM模型适用于金融市场的时间序列分析,能够有效捕捉隐藏状态及其转换规律,为金融预测提供有力工具。
|
3月前
|
机器学习/深度学习 人工智能 算法
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
手写数字识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Flask框架,开发网页端操作平台,实现用户上传一张图片识别其名称。
189 0
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
|
3月前
|
机器学习/深度学习 人工智能 算法
基于深度学习的【蔬菜识别】系统实现~Python+人工智能+TensorFlow+算法模型
蔬菜识别系统,本系统使用Python作为主要编程语言,通过收集了8种常见的蔬菜图像数据集('土豆', '大白菜', '大葱', '莲藕', '菠菜', '西红柿', '韭菜', '黄瓜'),然后基于TensorFlow搭建卷积神经网络算法模型,通过多轮迭代训练最后得到一个识别精度较高的模型文件。在使用Django开发web网页端操作界面,实现用户上传一张蔬菜图片识别其名称。
189 0
基于深度学习的【蔬菜识别】系统实现~Python+人工智能+TensorFlow+算法模型
|
3月前
|
机器学习/深度学习 人工智能 算法
青否数字人声音克隆算法升级,16个超真实直播声音模型免费送!
青否数字人的声音克隆算法全面升级,能够完美克隆真人的音调、语速、情感和呼吸。提供16种超真实的直播声音模型,支持3大AI直播类型和6大核心AIGC技术,60秒快速开播,助力商家轻松赚钱。AI讲品、互动和售卖功能强大,支持多平台直播,确保每场直播话术不重复,智能互动和真实感十足。新手小白也能轻松上手,有效规避违规风险。
|
3月前
|
分布式计算 Java 开发工具
阿里云MaxCompute-XGBoost on Spark 极限梯度提升算法的分布式训练与模型持久化oss的实现与代码浅析
本文介绍了XGBoost在MaxCompute+OSS架构下模型持久化遇到的问题及其解决方案。首先简要介绍了XGBoost的特点和应用场景,随后详细描述了客户在将XGBoost on Spark任务从HDFS迁移到OSS时遇到的异常情况。通过分析异常堆栈和源代码,发现使用的`nativeBooster.saveModel`方法不支持OSS路径,而使用`write.overwrite().save`方法则能成功保存模型。最后提供了完整的Scala代码示例、Maven配置和提交命令,帮助用户顺利迁移模型存储路径。