影视与游戏行业AI视频制作实战:第一步,角色形象设计的一致性

简介: 随着生成式人工智能技术的发展和应用,影视与游戏行业也迎来了AI化的时代。

随着生成式人工智能技术的发展和应用,影视与游戏行业也迎来了AI化的时代。AI不仅能更高效地完成图片、视频等多媒体作品的制作工作,还可以创造更加逼真、精细的视觉效果。魔搭社区结合社区出圈的AIGC应用能力,推出《影视与游戏行业AI视频制作实战》系列教程,将通过多个章节帮助大家快速且免费地使用开源模型和应用玩转AI视频创作。

下面我们开始第一步,角色形象设计一致性。

需求分析

1、人脸一致性:

角色无论在不同的时间点或场景中出现,都能被识别为同一人物。这要求角色的面部特征保持高度一致,确保观众能够无缝地识别和跟踪角色。

2、服化道一致性:

角色的服装、化妆和道具设计应保持一致性,这不仅适用于单个角色,也适用于多个角色之间的相互关系。这种一致性有助于构建一个连贯的剧情背景,增强观众的沉浸感和故事的可信度。

工具实测-使用预设风格

使用工具:

https://www.modelscope.cn/brand/view/FaceChain/branch=0&tree=3?branch=0&tree=1

预设风格如下:

选择部分风格实测:

评测:

  • 无论服化道如何变化,人脸总是保持一致,具备极强辨识度
  • 无论服化道如何变化,角色之间的风格也可以统一,满足画风一致性的需求

工具实测-DIY风格

如果预设风格不满足剧情设计,那么就需要来亲手训练一个LoRA风格,目前提供可视化界面的训练方式,零代码也可以完成。

使用工具:

https://www.modelscope.cn/brand/view/FaceChain/branch=0&tree=3?branch=0&tree=0

1、训练方式

  • 上传风格参考图

  • 确定标签词:每一张训练图片对应一组标签,风格lora模型会学习图片和对应标签的关系,提供了系统自动打标签方式,也支持手动修改,高频标签词会自动出现在写真生成的提示词中。

  • 设定触发词后开始训练:用户输入触发词后,系统会把它添加到每张训练图片的标签词里,方便lora建立触发词和风格的联系,后续也会自动出现在写真生成的提示词中。

2、效果实测

评测:新训练的LoRA效果与预制的风格一样好,可无限拓展~

训练出满意的LoRA风格可参赛

FaceChain风格大师创作大赛

https://www.modelscope.cn/brand/view/FaceChain/branch=0&tree=3?branch=0&tree=3(点击阅读原文即可参加)

更多期待

  1. 角色形象设计目前主要集中在上半身,希望可以通过基模优化+controlnet,更好支持到全身、侧身,同时也支持更多图片尺寸及分辨率
  2. 角色形象设计目前只支持单人版,希望支持多个角色形象同框展示
  3. 角色形象设计目前主要集中在写实分格,希望拓展更多非写实风格(举例水墨画风格、黏土风格等),兼具人脸相似度和风格统一性。

如果有相关突破,

可以提交github issue:https://github.com/modelscope/facechain  


相关文章
|
3月前
|
人工智能 JavaScript 前端开发
多角色AI代理的一次尝试- AI代码助手
本文介绍了一个多角色AI代理系统,用于自动化代码开发过程。系统包括用户接口、需求分析、代码结构设计、代码生成、代码审查和代码执行等角色,通过协调工作实现从需求到代码生成与测试的全流程自动化。使用了qwen2.5 7b模型,展示了AI在软件开发中的潜力。
|
1月前
|
存储 人工智能 运维
【01】做一个精美的打飞机小游戏,浅尝阿里云通义灵码python小游戏开发AI编程-之飞机大战小游戏上手实践-优雅草央千澈-用ai开发小游戏尝试-分享源代码和游戏包
【01】做一个精美的打飞机小游戏,浅尝阿里云通义灵码python小游戏开发AI编程-之飞机大战小游戏上手实践-优雅草央千澈-用ai开发小游戏尝试-分享源代码和游戏包
194 48
【01】做一个精美的打飞机小游戏,浅尝阿里云通义灵码python小游戏开发AI编程-之飞机大战小游戏上手实践-优雅草央千澈-用ai开发小游戏尝试-分享源代码和游戏包
|
1月前
|
人工智能 机器人 UED
不怕不会设计logo拉-本篇教你如何使用AI设计logo-如何快速用AI设计logo-附上AI绘图logo设计的咒语-优雅草央千澈-实战教程
不怕不会设计logo拉-本篇教你如何使用AI设计logo-如何快速用AI设计logo-附上AI绘图logo设计的咒语-优雅草央千澈-实战教程
147 86
不怕不会设计logo拉-本篇教你如何使用AI设计logo-如何快速用AI设计logo-附上AI绘图logo设计的咒语-优雅草央千澈-实战教程
|
2月前
|
机器学习/深度学习 人工智能 物联网
AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营
12月14日,由中国软件行业校园招聘与实习公共服务平台携手魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行AIGC项目实战营·湖南大学站圆满结营。
AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营
|
30天前
|
人工智能 数据处理 语音技术
Pipecat实战:5步快速构建语音与AI整合项目,创建你的第一个多模态语音 AI 助手
Pipecat 是一个开源的 Python 框架,专注于构建语音和多模态对话代理,支持与多种 AI 服务集成,提供实时处理能力,适用于语音助手、企业服务等场景。
103 23
Pipecat实战:5步快速构建语音与AI整合项目,创建你的第一个多模态语音 AI 助手
|
1月前
|
机器学习/深度学习 人工智能 iOS开发
MagicMirror:一键 AI 换脸、换发型和换穿搭,拖放照片就能实现换脸和形象变换,本地运行无需配置
MagicMirror 是一款开源的一键 AI 换脸、换发型和穿搭应用,支持离线处理,保护隐私,轻量级设计,适合个人娱乐和创意内容创作。
138 13
MagicMirror:一键 AI 换脸、换发型和换穿搭,拖放照片就能实现换脸和形象变换,本地运行无需配置
|
2月前
|
人工智能
AnchorCrafter:中科院联合腾讯推出的AI虚拟主播带货视频制作技术
AnchorCrafter是由中科院和腾讯联合推出的一项AI虚拟主播带货视频制作技术。该技术基于扩散模型,能够自动生成高保真度的主播风格产品推广视频,通过整合人-物交互(HOI)技术,实现对物体外观和运动控制的高度还原。AnchorCrafter在物体外观保持、交互感知以及视频质量方面优于现有方法,为在线广告和消费者参与提供了新的可能性。
795 30
AnchorCrafter:中科院联合腾讯推出的AI虚拟主播带货视频制作技术
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
DiffSensei:AI 漫画生成框架,能生成内容可控的黑白漫画面板,支持多角色和布局控制
DiffSensei 是一个由北京大学、上海AI实验室及南洋理工大学共同推出的AI漫画生成框架,能够生成可控的黑白漫画面板。该框架整合了基于扩散的图像生成器和多模态大型语言模型(MLLM),支持多角色控制和精确布局控制,适用于漫画创作、个性化内容生成等多个领域。
167 18
DiffSensei:AI 漫画生成框架,能生成内容可控的黑白漫画面板,支持多角色和布局控制
|
2月前
|
机器学习/深度学习 人工智能 JSON
【实战干货】AI大模型工程应用于车联网场景的实战总结
本文介绍了图像生成技术在AIGC领域的发展历程、关键技术和当前趋势,以及这些技术如何应用于新能源汽车行业的车联网服务中。
573 37
|
2月前
|
机器学习/深度学习 人工智能 物联网
AI赋能大学计划·大模型技术与应用实战学生训练营——电子科技大学站圆满结营
12月05日,由中国软件行业校园招聘与实习公共服务平台携手阿里魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行AIGC项目实战营·电子科技大学站圆满结营。
AI赋能大学计划·大模型技术与应用实战学生训练营——电子科技大学站圆满结营

热门文章

最新文章