AI 绘画Stable Diffusion 研究(十二)SD数字人制作工具SadTlaker插件安装教程

简介: AI 绘画Stable Diffusion 研究(十二)SD数字人制作工具SadTlaker插件安装教程

免责声明:
本案例所用安装包免费提供,无任何盈利目的。


大家好,我是风雨无阻。


想必大家经常看到,无论是在产品营销还是品牌推广时,很多人经常以数字人的方式来为自己创造财富。而市面上的数字人收费都比较昂贵,少则几千,多则上万。


那么如何才能拥有一个免费的数字人生成工具呢?

其实很简单,只需要在stable diffusion上安装sadtalker插件就能轻松生成自己的数字人。

而且只需简单3步即可!


大家跟着我的步骤,赶紧实操起来,看看效果吧。


注意:本教程适用于秋葉Stable Diffusion整合包的SadTlaker安装。


第一步,SadTlaker 主文件的安装


(1)、浏览器中打开 SadTalker项目地址

https://github.com/OpenTalker/SadTalker


(2)、下载 SadTalker压缩包


如果下载比较慢,或者无法下载的朋友,可以前往我这里已下载好的sadtalker安装文件

https://pan.baidu.com/s/15MRdrNnKi7Q0l48jZO_wgg?pwd=mhbz


(3)、安装SadTalker

我们下载SadTalker 后,会得到名字为:SadTalker-main.zip的压缩包。

  • step 1 解压SadTalker-main.zip
  • step 2 重命名为:SadTalker (注意:这里一定要改,不改识别不了)
  • step 3 将SadTalker文件夹拷贝到 sd-webui-aki-v4.2\extensions 目录下
\sd-webui-aki-v4.2\extensions\SadTalker


安装后的目录:


  • step 4 重启Stable Diffusion
    重启后,可以看到功能栏上,已经出现了SadTalker 标签
    如图:


第二步,FFmpeg的安装


(1)、什么是ffmpeg ?

FFmpeg是开源的跨平台多媒体处理工具,它可以用于录制、转换音频和视频内容。它包含了一套强大的命令行程序,可以执行各种音视频处理任务,例如格式转换、剪辑、合并、解码、编码、截图等。


(2)、下载ffmpeg

下载ffmpeg可以进入ffmpeg官网下载地址

https://www.gyan.dev/ffmpeg/builds/ffmpeg-git-full.7z 


如果下载比较慢,或者无法下载的朋友,可以前往我这里已下载好的ffmpeg安装文件

https://pan.baidu.com/s/196m5bSoUR8DYA03VjnxeeQ?pwd=fxb7

但无论你从哪里下载的ffmpeg文件,都需要给它配置环境变量,才能正常工作。


(3)、解压 ffmpeg 并配置环境变量

我这里直接解压到这个目录,并重新命名为ffmpeg :

C:\Program Files\ffmpeg



然后需要配置系统环境变量:


  • step 1 我的电脑,鼠标右键菜单,属性->设置


  • step 2 打开高级系统设置窗口


  • step 3 打开环境变量窗口


  • step 4 双击 Path栏,打开编辑环境变量窗口


在最后增加刚才解压后的ffmpeg/bin目录,然后点击确定,保存。

C:\Program Files\ffmpeg\bin


第三步,Sadtalker模型文件的安装


(1)、下载 Sadtalker模型文件

Sadtalker模型文件 包含 main checkpointsgfpgan 可以去Sadtalker官网提供的下载链接下载 。


main checkpoints 下载地址:

https://drive.google.com/file/d/1gwWh45pF7aelNP_P78uDJL8Sycep-K7j/view 

gfpgan 下载地址:

https://drive.google.com/file/d/19AIBsmfcHW6BRJmeqSFlG5fL445Xmsyi/edit


如果下载速度比较慢,也可以去我已经下载好的地址进行下载 。

我准备的gfpgan下载地址:

https://pan.baidu.com/s/1vaqYw-vpreNaNfGUE7wJ3Q?pwd=4efd 


我准备的 Sadtalker checkpoints下载地址:

https://pan.baidu.com/s/1_SXnKa7v8wh1qM2iJOhGwg?pwd=hhat  


(2)、安装checkpoints 和 gfpgan

将下载好的 checkpoints.zip 文件解压到 \sd-webui-aki-v4.2\extensions\SadTalker 目录

注意:如果是在官方网站下载的 checkpoints 压缩包 ,解压后需要重命名为:checkpoints

\sd-webui-aki-v4.2\extensions\SadTalker\checkpoints


如图:


将下载好的 gfpgan.zip 文件解压到 \sd-webui-aki-v4.2\extensions\SadTalker 目录

\sd-webui-aki-v4.2\extensions\SadTalker\gfpgan

如图:


至此,Sadtalker 安装就完成了。

下一篇,我们将介绍 Sadtalker 工具的简单使用,制作一个会说话的数字人视频,敬请期待。


相关文章
|
2月前
|
机器学习/深度学习 人工智能
打开AI黑匣子,三段式AI用于化学研究,优化分子同时产生新化学知识,登Nature
【10月更文挑战第11天】《自然》杂志发表了一项突破性的化学研究,介绍了一种名为“Closed-loop transfer”的AI技术。该技术通过数据生成、模型训练和实验验证三个阶段,不仅优化了分子结构,提高了光稳定性等性质,还发现了新的化学现象,为化学研究提供了新思路。此技术的应用加速了新材料的开发,展示了AI在解决复杂科学问题上的巨大潜力。
38 1
|
5天前
|
机器学习/深度学习 人工智能 自然语言处理
AI自己长出了类似大脑的脑叶?新研究揭示LLM特征的惊人几何结构
近年来,大型语言模型(LLM)的内部运作机制备受关注。麻省理工学院的研究人员在论文《The Geometry of Concepts: Sparse Autoencoder Feature Structure》中,利用稀疏自编码器(SAE)分析LLM的激活空间,揭示了其丰富的几何结构。研究发现,特征在原子、大脑和星系三个尺度上展现出不同的结构,包括晶体结构、中尺度模块化结构和大尺度点云结构。这些发现不仅有助于理解LLM的工作原理,还可能对模型优化和其他领域产生重要影响。
46 25
|
18天前
|
人工智能 自然语言处理 前端开发
Lobe Vidol:AI数字人交互平台,可与虚拟人和3D模型聊天互动
Lobe Vidol是一款开源的AI数字人交互平台,允许用户创建和互动自己的虚拟偶像。该平台提供流畅的对话体验、丰富的动作姿势库、优雅的用户界面设计以及多种技术支持,如文本到语音和语音到文本技术。Lobe Vidol适用于娱乐互动、在线教育、客户服务、品牌营销和社交媒体等多个应用场景。
76 7
Lobe Vidol:AI数字人交互平台,可与虚拟人和3D模型聊天互动
|
2天前
|
人工智能 程序员 Linux
神秘山洞惊现AI绘画至宝Stable Diffusion残卷
随着AI神器的现世,不少修士担忧其会取代人类职业。然而,自女娲创造人类以来,法宝虽强,始终只是辅助工具,需修士操控才能发挥威力。如今修仙界最大的至宝是GPT,它能以文字为引,转化出所需答案。图片处理方面也有Stable Diffusion、DALL-E等法宝。这些AI工具并非替代修士,而是提升效率的助手。例如,Stable Diffusion最初由慕尼黑和海德堡大学宗师炼制,现已发展多个版本,如v1、v2.0、SDXL等,帮助修士更便捷地生成图像。通过合理使用这些工具,修士们可以更好地实现心中所想,而非被技术取代。
23 6
|
25天前
|
人工智能 开发者
人类自身都对不齐,怎么对齐AI?新研究全面审视偏好在AI对齐中的作用
论文《AI对齐中的超越偏好》挑战了偏好主义AI对齐方法,指出偏好无法全面代表人类价值观,存在冲突和变化,并受社会影响。文章提出基于角色的对齐方案,强调AI应与其社会角色相关的规范标准一致,而非仅关注个人偏好,旨在实现更稳定、适用性更广且更符合社会利益的AI对齐。论文链接:https://arxiv.org/pdf/2408.16984
33 2
|
1月前
|
人工智能 知识图谱
成熟的AI要学会自己搞研究!MIT推出科研特工
MIT推出科研特工SciAgents,结合生成式AI、本体表示和多代理建模,实现科学发现的自动化。通过大规模知识图谱和多代理系统,SciAgents能探索新领域、识别复杂模式,加速新材料发现,展现跨学科创新潜力。
43 12
|
1月前
|
机器学习/深度学习 人工智能 算法
基于AI的性能优化技术研究
基于AI的性能优化技术研究
|
2月前
|
人工智能
添加一个Stable Difussion图像生成应用,通过向AI助手简单的提问,即可快速搭建Stable Diffusion应用至自己的网站中,大幅提升开发效率。
添加一个Stable Difussion图像生成应用,通过向AI助手简单的提问,即可快速搭建Stable Diffusion应用至自己的网站中,大幅提升开发效率。
|
2月前
|
人工智能 自然语言处理
召唤100多位学者打分,斯坦福新研究:AI科学家创新确实强
【10月更文挑战第6天】斯坦福大学最新研究评估了大型语言模型(LLMs)在生成新颖研究想法方面的能力,通过100多位NLP专家盲评LLMs与人类研究人员提出的想法。结果显示,LLMs在新颖性方面超越人类(p < 0.05),但在可行性上略逊一筹。研究揭示了LLMs作为科研工具的潜力与挑战,并提出了进一步验证其实际效果的设计。论文详见:https://arxiv.org/abs/2409.04109。
48 6
|
2月前
|
人工智能 自然语言处理 机器人
MIT新研究揭秘AI洗脑术!AI聊天诱导人类编造记忆,真假难辨
麻省理工学院的一项新研究《基于大型语言模型的对话式AI在证人访谈中加剧虚假记忆》显示,使用生成式聊天机器人进行犯罪证人访谈会显著增加参与者的虚假记忆,且影响持久。研究设置了对照组、问卷访谈、预设脚本及生成式聊天机器人四种条件,结果显示生成式聊天机器人诱导的虚假记忆数量远超其他方法。尽管AI技术在效率和准确性方面潜力巨大,但在敏感领域需谨慎应用,并需进一步评估风险,制定伦理准则和监管措施。论文详细内容见[这里](https://arxiv.org/abs/2408.04681)。
57 2

热门文章

最新文章

下一篇
DataWorks