一看就会的 AI 换脸项目教程!5分钟速通明星大模型开源项目一键部署

本文涉及的产品
可观测监控 Prometheus 版,每月50GB免费额度
函数计算FC,每月15万CU 3个月
注册配置 MSE Nacos/ZooKeeper,118元/月
简介: 有了通义灵码的帮助,很多明星大模型项目实操过程中遇到的问题:查找错误、解释代码、优化代码、查找文档、代码补全等等都可以用通义灵码一键解决,而且准确率很高,加上灵活的实操环境,项目跑起来会非常高效。关键是通义灵码个人版还免费!

视频里,两个正在跳舞的小姐姐,你能看出什么异常吗?再放大点。


她们的动作表情完全一模一样,但右边的这位,是 AI 换脸,是不是完全看不出瑕疵。


这个就是非常爆火,并且在 GitHub 拥有25k star 的一个最新 AI 换脸项目 roop。短短几周星标人数就疯狂增长。它的效果非常真实,以后想看谁跳舞就可以看谁跳舞,想看谁演电影就能看谁演电影。


虽然说这个 AI 换脸项目已经开源,但市面上对于这块的详细教程并不多,而且不是要收费,就是生成的效果太假。


所以今天这期视频,就是一期保姆级教程 AI 换脸项目roop的视频教程。我们将用AI编程工具-通义灵码来进行实操教学,它是目前最受国内开发者欢迎的AI编程工具。有了通义灵码的帮助,很多明星大模型项目实操过程中遇到的问题:查找错误、解释代码、优化代码、查找文档、代码补全等等都可以用通义灵码一键解决,而且准确率很高,加上灵活的实操环境,项目跑起来会非常高效。关键是通义灵码个人版还免费!话不多说,直接开干。


实操演示

1. 以PyCharm开发环境为例,在文件菜单下点击设置。然后点击导航-插件,打开应用市场,搜索通义灵码(TONGYI Lingma),找到通义灵码后点击安装,然后登录自己阿里云账号就可以使用了。它这个像主流的编程语言和工具都是支持的。比如Visual Studio Code、Visual Studio、JetBrains IDEs。


2. 第一步,首先需要将roop项目的源代码克隆到我们的开发环境下。打开终端,在终端输入git clone https://github.com/s0md3v/roop.git 就可以将代码克隆到当前的工作目录下了。


3. 当我们面对一个全新的开发源代码库的时候,我们可以借助通义灵码来帮助我们熟悉各个程序文件。直接对话框内唤起@workspace,对他说,帮我梳理roop代码库的结构,它就会为你详细解释各个程序文件了,这样看是不是就一目了然了。


4. 然后我们要给电脑安装好FFmpeg,这个是图像处理领域经常使用的工具。像这种常用的工具说明文档我会放在团队知识库中,问通义灵码,它就会调用知识库提供详细的安装方法。在对话框内输入#team docs,然后就可以进行提问了。这也是通义灵码的一个核心能力叫企业知识库检索增强,在开发者使用通义灵码 IDE 插件时,可以结合企业上传的文档、文件等内容作为上下文进行回答,这样获得的答案也更贴合企业自己的特点。下载解压后进入 bin 目录,复制 bin 目录路径。在[编辑环境变量]表中将刚才复制的 bin目录路径粘贴进去,保存。


5. 为了不与之前配置的开发环境混淆,我们需要使用conda创建一个虚拟环境,在终端输入 conda create --name roop python=3.10。


6. 接下来,我们需要给显卡配置CUDA的开发环境。在终端输入


pip install torch==2.0.0+cu118 torchvision==0.15.1+cu118 torchaudio==2.0.1 --index-url https://download.pytorch.org/whl/cu118


随后执行pip install -r requirements.txt来安装环境。


7. 这里遇到了路径报错。这个时候如果自己去一个一个检查代码会很费时间,AI编程工具能有效解决这个问题,我们可以打开通义灵码对话框,将报错的内容输入进对话框中,就一下知道哪里错了,此外,通义灵码也有一键修复问题的能力,只需要一键就能帮你快速修改bug。可以看到现在的绝对路径下没有 requirements.txt 这个文件,需要将路径切换到 roop 目录下。OK 指令能够被正确执行了。


8. 接下来,我们可以在终端中输入pip install onnxruntime-gpu来安装GPU版本的 onnxruntime-gpu。好了后就可以输入 python run.py 来执行我们的主程序。


9. 成功运行程序后,就可以选择想要换脸的照片和视频,然后点击 Start 开始处理视频。然后就搞定了。


10. 最后我们还可以对项目的参数做一些调整,像这个大模型的项目参数就会比较复杂不好理解,可以让通义灵码一键解释下,比如这个max-memory,让它来帮忙分析一下。原来这个是用来指定程序运行时最大的内存使用量的。我们可以尝试一下,将这个最大内存设置为8GB。我们可以在终端中输入 python run.py  --max-memory 8 程序被成功运行了起来。


当然输入的参数还涵盖了很多陌生的技术名词,这里也可以启动@workspace来理解这些变量比如说一个很重要的参数fps,询问下“代码里面出现了--keep-fps这个参数,能详细介绍一下这个参数的作用吗”,我们就能获得一个清晰的解释了。


因为过程有通义灵码的辅助,不仅可以快速对整个程序代码有清晰的理解、出现报错一键优化,还可以有自己的专属知识库,让AI一键查找回答,整体过程体验下来很简单高效,试一遍你就知道多简单。


相关素材:

通义灵码工具下载:https://tongyi.aliyun.com/lingma/download

项目下载:git clone https://github.com/s0md3v/roop.git

虚拟环境创建:conda create --name roop python=3.10

ffmpeg下载:https://ffmpeg.org/


来!体验一下


点击下方链接,体验用通义灵码实现开源项目一键部署,玩转开源项目上手实操,还能领取通义灵码超大定制鼠标垫哦~

活动专区:https://developer.aliyun.com/topic/lingma/202407

image.png

相关实践学习
2分钟自动化部署人生模拟器
本场景将带你借助云效流水线Flow实现人生模拟器小游戏的自动化部署
SVN版本控制系统
SVN是现在软件开发之中的主流软件版本控制工具,在工作之中利用SVN可以有效的解决多人开发的代码管理问题,本课程将为读者讲解SVN服务器的配置以及基于MyEclipse的SVN客户端插件的配置与使用,并且在讲解之中着重讲解了冲突的产生于解决。
相关文章
|
11天前
|
人工智能 Java Serverless
阿里云函数计算助力AI大模型快速部署
随着人工智能技术的快速发展,AI大模型已经成为企业数字化转型的重要工具。然而,对于许多业务人员、开发者以及企业来说,探索和利用AI大模型仍然面临诸多挑战。业务人员可能缺乏编程技能,难以快速上手AI模型;开发者可能受限于GPU资源,无法高效构建和部署AI应用;企业则希望简化技术门槛,以更低的成本和更高的效率利用AI大模型。
63 12
|
10天前
|
人工智能 安全 数据安全/隐私保护
文档智能 & RAG让AI大模型更懂业务测评
文档智能 & RAG让AI大模型更懂业务
129 73
|
11天前
|
机器学习/深度学习 人工智能 自然语言处理
GLM-4V-Flash:智谱 AI 免费开放的图像理解大模型 API 接口
智谱AI推出的GLM-4V-Flash是一款专注于图像理解的免费开放大模型,提供API接口支持用户上传图片URL或Base64编码图片获取详细的图像描述。该模型通过深度学习和卷积神经网络技术,简化了图像分析流程,提高了开发效率,适用于内容审核、辅助视障人士、社交媒体、教育和电子商务等多个应用场景。
79 14
GLM-4V-Flash:智谱 AI 免费开放的图像理解大模型 API 接口
|
8天前
|
机器学习/深度学习 人工智能 自然语言处理
MMAudio:开源 AI 音频合成项目,根据视频或文本生成同步的音频
MMAudio 是一个基于多模态联合训练的高质量 AI 音频合成项目,能够根据视频内容或文本描述生成同步的音频。该项目适用于影视制作、游戏开发、虚拟现实等多种场景,提升用户体验。
49 7
MMAudio:开源 AI 音频合成项目,根据视频或文本生成同步的音频
|
9天前
|
人工智能 缓存 异构计算
云原生AI加速生成式人工智能应用的部署构建
本文探讨了云原生技术背景下,尤其是Kubernetes和容器技术的发展,对模型推理服务带来的挑战与优化策略。文中详细介绍了Knative的弹性扩展机制,包括HPA和CronHPA,以及针对传统弹性扩展“滞后”问题提出的AHPA(高级弹性预测)。此外,文章重点介绍了Fluid项目,它通过分布式缓存优化了模型加载的I/O操作,显著缩短了推理服务的冷启动时间,特别是在处理大规模并发请求时表现出色。通过实际案例,展示了Fluid在vLLM和Qwen模型推理中的应用效果,证明了其在提高模型推理效率和响应速度方面的优势。
云原生AI加速生成式人工智能应用的部署构建
|
9天前
|
机器学习/深度学习 人工智能 物联网
AI赋能大学计划·大模型技术与应用实战学生训练营——电子科技大学站圆满结营
12月05日,由中国软件行业校园招聘与实习公共服务平台携手阿里魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行AIGC项目实战营·电子科技大学站圆满结营。
AI赋能大学计划·大模型技术与应用实战学生训练营——电子科技大学站圆满结营
|
3天前
|
人工智能 API Windows
免费部署本地AI大语言模型聊天系统:Chatbox AI + 马斯克grok2.0大模型(简单5步实现,免费且比GPT4.0更好用)
本文介绍了如何部署本地AI大语言模型聊天系统,使用Chatbox AI客户端应用和Grok-beta大模型。通过获取API密钥、下载并安装Chatbox AI、配置模型,最终实现高效、智能的聊天体验。Grok 2大模型由马斯克X-AI发布,支持超长文本上下文理解,免费且易于使用。
25 0
|
机器学习/深度学习 人工智能 算法
AI项目成功的4要素
如何确保你的项目保持在正轨上。如果你是产品经理,想要用机器学习来做一些事情,这里列出了 4 件最重要的事情
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术深度解析:从基础到应用的全面介绍
人工智能(AI)技术的迅猛发展,正在深刻改变着我们的生活和工作方式。从自然语言处理(NLP)到机器学习,从神经网络到大型语言模型(LLM),AI技术的每一次进步都带来了前所未有的机遇和挑战。本文将从背景、历史、业务场景、Python代码示例、流程图以及如何上手等多个方面,对AI技术中的关键组件进行深度解析,为读者呈现一个全面而深入的AI技术世界。
50 10
|
9天前
|
机器学习/深度学习 人工智能 自然语言处理
转载:【AI系统】AI的领域、场景与行业应用
本文概述了AI的历史、现状及发展趋势,探讨了AI在计算机视觉、自然语言处理、语音识别等领域的应用,以及在金融、医疗、教育、互联网等行业中的实践案例。随着技术进步,AI模型正从单一走向多样化,从小规模到大规模分布式训练,企业级AI系统设计面临更多挑战,同时也带来了新的研究与工程实践机遇。文中强调了AI基础设施的重要性,并鼓励读者深入了解AI系统的设计原则与研究方法,共同推动AI技术的发展。
转载:【AI系统】AI的领域、场景与行业应用
下一篇
DataWorks