52个AIGC视频生成算法模型介绍(中)

简介: 52个AIGC视频生成算法模型介绍(中)

52个AIGC视频生成算法模型介绍(上):https://developer.aliyun.com/article/1480690


  • Pix2Video: Video Editing using Image Diffusion


机构:Abode

时间:2023.3.22

https://duyguceylan.github.io/pix2video.github.io/


  • InstructVid2Vid: Controllable Video Editing with Natural Language Instructions


机构:浙大

时间:2023.5.21


  • ControlVideo: Training-free Controllable Text-to-Video Generation


机构:华为

时间:2023.5.22

https://github.com/YBYBZhang/ControlVideo


  • ControlVideo: Conditional Control for One-shot Text-driven Video Editing and Beyond


机构:清华

时间:2023.11.28

https://github.com/thu-ml/controlvideo


  • Control-A-Video: Controllable Text-to-Video Generation with Diffusion Models


时间:2023.12.6https://controlavideo.github.io/


  • StableVideo: Text-driven Consistency-aware Diffusion Video Editing


机构:MSRA

时间:2023.8.18

https://github.com/rese1f/StableVideo


  • MagicEdit: High-Fidelity and Temporally Coherent Video Editing


机构:字节

时间:2023.8.28

https://magic-edit.github.io/(未开源)


  • GROUND-A-VIDEO: ZERO-SHOT GROUNDED VIDEO EDITING USING TEXT-TO-IMAGE DIFFUSION MODELS


机构:KAIST时间:2023.10.2https://ground-a-video.github.io/

  • FateZero: Fusing Attentions for Zero-shot Text-based Video Editing


机构:腾讯AI Lab时间:2023.10.11

https://fate-zero-edit.github.io


  • Motion-Conditioned Image Animation for Video Editing


机构:Meta

时间:2023.11.30

facebookresearch.github.io/MoCA(未开源)


  • VidEdit: Zero-shot and Spatially Aware Text-driven Video Editing


机构:Sorbonne Université, Paris, France

时间:2023.12.15

https://videdit.github.io


  • Zero-Shot Video Editing Using Off-The-Shelf Image Diffusion Models


时间:2024.1.4https://github.com/baaivision/vid2vid-zero

 人物动态化



主要是通过人体姿态作为条件性输入(结合controlnet等),将一张图作为前置参考图,或者直接使用文本描述生成图片。其中阿里和字节分别有几篇代表性论文,其中字节的代码有两篇已经开源,阿里的代码还在等待阶段。


  • Follow Your Pose


机构:腾讯AI Lab

时间:2023.4.3

https://follow-your-pose.github.io/

  • DreamPose: Fashion Image-to-Video Synthesis via Stable Diffusion


机构:google,nvidia

时间:2023.5.4

https://grail.cs.washington.edu/projects/dreampose/


  • DISCO: Disentangled Control for Realistic Human Dance Generation


机构:微软

时间:2023.10.11

https://disco-dance.github.io


  • MagicAnimate: Temporally Consistent Human Image Animation using Diffusion Model


机构:字节

时间:2023.11.27

https://showlab.github.io/magicanimate/


  • MaigcDance


机构:字节

时间:2023.11.18

https://boese0601.github.io/magicdance/


  • Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation


机构:阿里

时间:2023.12.7

https://humanaigc.github.io/animate-anyone/(未开源)

  • DreaMoving: A Human Video Generation Framework based on Diffusion Model


机构:阿里

时间:2023.12.11

https://dreamoving.github.io/dreamoving(未开源)

52个AIGC视频生成算法模型介绍(下):https://developer.aliyun.com/article/1480687

目录
相关文章
|
6天前
|
算法
基于模糊PI控制算法的龙格库塔CSTR模型控制系统simulink建模与仿真
本项目基于MATLAB2022a,采用模糊PI控制算法结合龙格-库塔方法,对CSTR模型进行Simulink建模与仿真。通过模糊控制处理误差及变化率,实现精确控制。核心在于将模糊逻辑与经典数值方法融合,提升系统性能。
|
6天前
|
存储 算法
基于HMM隐马尔可夫模型的金融数据预测算法matlab仿真
本项目基于HMM模型实现金融数据预测,包括模型训练与预测两部分。在MATLAB2022A上运行,通过计算状态转移和观测概率预测未来值,并绘制了预测值、真实值及预测误差的对比图。HMM模型适用于金融市场的时间序列分析,能够有效捕捉隐藏状态及其转换规律,为金融预测提供有力工具。
|
1月前
|
机器学习/深度学习 人工智能 算法
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
手写数字识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Flask框架,开发网页端操作平台,实现用户上传一张图片识别其名称。
76 0
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
|
1月前
|
机器学习/深度学习 人工智能 算法
基于深度学习的【蔬菜识别】系统实现~Python+人工智能+TensorFlow+算法模型
蔬菜识别系统,本系统使用Python作为主要编程语言,通过收集了8种常见的蔬菜图像数据集('土豆', '大白菜', '大葱', '莲藕', '菠菜', '西红柿', '韭菜', '黄瓜'),然后基于TensorFlow搭建卷积神经网络算法模型,通过多轮迭代训练最后得到一个识别精度较高的模型文件。在使用Django开发web网页端操作界面,实现用户上传一张蔬菜图片识别其名称。
79 0
基于深度学习的【蔬菜识别】系统实现~Python+人工智能+TensorFlow+算法模型
|
1月前
|
机器学习/深度学习 人工智能 算法
青否数字人声音克隆算法升级,16个超真实直播声音模型免费送!
青否数字人的声音克隆算法全面升级,能够完美克隆真人的音调、语速、情感和呼吸。提供16种超真实的直播声音模型,支持3大AI直播类型和6大核心AIGC技术,60秒快速开播,助力商家轻松赚钱。AI讲品、互动和售卖功能强大,支持多平台直播,确保每场直播话术不重复,智能互动和真实感十足。新手小白也能轻松上手,有效规避违规风险。
|
1月前
|
分布式计算 Java 开发工具
阿里云MaxCompute-XGBoost on Spark 极限梯度提升算法的分布式训练与模型持久化oss的实现与代码浅析
本文介绍了XGBoost在MaxCompute+OSS架构下模型持久化遇到的问题及其解决方案。首先简要介绍了XGBoost的特点和应用场景,随后详细描述了客户在将XGBoost on Spark任务从HDFS迁移到OSS时遇到的异常情况。通过分析异常堆栈和源代码,发现使用的`nativeBooster.saveModel`方法不支持OSS路径,而使用`write.overwrite().save`方法则能成功保存模型。最后提供了完整的Scala代码示例、Maven配置和提交命令,帮助用户顺利迁移模型存储路径。
|
1月前
|
机器学习/深度学习 人工智能 算法
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型
车辆车型识别,使用Python作为主要编程语言,通过收集多种车辆车型图像数据集,然后基于TensorFlow搭建卷积网络算法模型,并对数据集进行训练,最后得到一个识别精度较高的模型文件。再基于Django搭建web网页端操作界面,实现用户上传一张车辆图片识别其类型。
81 0
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型
|
3月前
|
机器学习/深度学习 人工智能 算法
鸟类识别系统Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+ResNet50算法模型+图像识别
鸟类识别系统。本系统采用Python作为主要开发语言,通过使用加利福利亚大学开源的200种鸟类图像作为数据集。使用TensorFlow搭建ResNet50卷积神经网络算法模型,然后进行模型的迭代训练,得到一个识别精度较高的模型,然后在保存为本地的H5格式文件。在使用Django开发Web网页端操作界面,实现用户上传一张鸟类图像,识别其名称。
115 12
鸟类识别系统Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+ResNet50算法模型+图像识别
|
2月前
|
机器学习/深度学习 数据采集 算法
如何在一夜之间成为模型微调大师?——从零开始的深度学习修炼之旅,让你的算法功力飙升!
【10月更文挑战第5天】在机器学习领域,预训练模型具有强大的泛化能力,但直接使用可能效果不佳,尤其在特定任务上。此时,模型微调显得尤为重要。本文通过图像分类任务,详细介绍如何利用PyTorch对ResNet-50模型进行微调,包括环境搭建、数据预处理、模型加载与训练等步骤,并提供完整Python代码。通过调整超参数和采用早停策略等技巧,可进一步优化模型性能。适合初学者快速上手模型微调。
117 8
|
2月前
|
机器学习/深度学习 算法 搜索推荐
django调用矩阵分解推荐算法模型做推荐系统
django调用矩阵分解推荐算法模型做推荐系统
40 4