AI拖动改图项目火热上线,亲测效果分享!

简介: AI拖动改图项目火热上线,亲测效果分享!

这两天有一个AI拖动改图的项目特别火,看官方分享的演示视频,效果特别震撼!

1689160751472.png

为了获取第一手的真实体验,我也第一时间部署了这个项目,并实际体验了一下。

坦白的说,它的实际效果和演示视频还是有些差距的,操作上并没有那么顺滑,一是自动生成的UI,交互体验不太友好,二是它对计算资源的要求比较高,如果机器不行会比较卡。对项目比较熟悉的大佬在回应网友时也说到这只是一个研究项目,和商用产品还有比较大的差距。

不过这个工具确实能解决一些问题,比如想给照片中的人或者动物换个优美的姿势,以及重新设计产品的外观等。也许再经过一段时间的迭代,它就能像AI绘图一样让大家爱不释手了。所以,我还是详细分享下我的体验过程,也给想尝试的同学提供一个参考。

安装说明

这个项目是在Github上开源的,本质是基于生成对抗网络的深度学习模型,访问地址:github.com/XingangPan/…

一开始我本来打算自己搭建环境部署,但是总遇到各种问题,折腾了几下就放弃了,后来在项目的Issues讨论区中看到有Google Colab版本,所以就直接拿过来跑了。

这是我的notebook,大家可以直接拷贝运行:colab.research.google.com/drive/1Cah5…

代码很简单,我这里简单介绍下:

!git clone  https://huggingface.co/spaces/radames/DragGan/
!pip install -r /content/DragGan/requirements.txt
%cd  /content/DragGan
!python  visualizer_drag_gradio.py --share

首先是从huggingface拷贝核心程序,由此可见大佬是在huggingface完成初次程序部署的;然后安装Gradio及其依赖的程序包;最后进入程序目录,启动程序。

这里为什么要装Gradio?首先这是一个让模型可视化的工具,方便我们进行调测;其次程序是在notebook中运行的,默认只能本机访问,Gradio可以做一个内网穿透,这样我们就可以在本地的浏览器操作。

为了给没操作过Google Colab的同学一些指引,我这里说下如何启动Notebook。

进入Notebook后,首先点击右上角这里的“连接”,Notebook就会自动创建服务器并启动它。

1689160850473.png

服务器启动成功后,这里会显示内存和磁盘的监控缩略图:

1689160889706.png

点击右侧的这个小箭头,在打开的下拉菜单中点击“查看资源”,就可以看到内存、GPU和磁盘的情况:

1689160921144.png

注意上图中的“GPU RAM”,这个代表显卡的显存使用情况,如果你的资源中没有这个项目,说明没有启用GPU,需要点击页面下方的“更改运行时类型”,在这里选择“硬件加速器”为GPU,GPU类型选择T4,如果付费了可以选择更好的。

1689160962624.png

程序启动成功后,日志这里会输出外网可以访问的Gradio地址,直接点击就会在浏览器打开。

1689160991860.png

使用说明

在打开的浏览器页面中,你会看到类似下图的一个页面:左边是一些控制参数和操作按钮,右边是待处理的图片区域。

1689161027889.png


这里我们做一个使用演示:

在页面的左上角,Pretrained Model 这里,我们选择 “stylegan2_dogs_1024_pytorch”,这是一些狗狗的预训练模型。模型选中后,右边就会加载一张狗狗的图片,这个图片是随机的。调整左侧的“See点”可以更换图片。

我这里的这个狗狗目光看向右边,我想让他把头扭过来,看着观众,这样可以增加一些亲近感!

具体操作步骤是:

1、在图片上点击想要拖拽的地方,点击完毕后,程序会进行一次处理,等待处理完毕,会显示一个红色的点。

2、在图片上点击要拖动到的地方,点击完毕后,程序还是会进行一次处理,等待即可,最后会显示一个蓝色的点。

1689161069310.png

3、点击Mask区域的“Edit Flexible Area”,点击完毕后,程序会进行一次处理,等待处理完毕。

1689161105381.png

4、然后我们点击图片右上角这个笔刷的按钮,把笔刷调整的大些,这样比较好涂抹。

1689161132493.png

5、然后涂抹,把狗狗的头部遮盖住,这一步的目的就是让拖动效果只影响遮盖的部分。

1689161216157.png

6、然后点击“Start”,开始拖拽调整。

1689161245468.png

可以看到图像会一步步接近我们的拖放点。

1689161413295.png

7、这个调整程序有时候长时间停不下来,可以点击“Stop”按钮停止运行,也可以刷新页面重载程序。

1689161446678.png

8、如果调整的效果不满意,可以多次调整,直到调整到最佳位置。

我这里技巧掌握的还不是很好,调整出来有点怪。

1689161478496.png

以上就是本文的主要内容了,从我的实际体验来说,比较卡,没有官宣的那么丝滑,可能是因为显卡的能力不够,有更好显卡的同学可以再试试,还有一部分原因是UI交互设计上的问题,每点一下图片部分都要重绘,加上网络传输,每次操作都要消耗若干秒或十几秒,应该可以合并一些前端操作再发到后端处理。

因本人能力有限,不免出现错漏,欢迎指正,感谢你的阅读。后续我会继续分享AI应用方面的东西,大家有兴趣的及时加我关注(微信公众号:萤火遛AI),以免错过精彩内容。

相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
2月前
|
人工智能 物联网 机器人
『GitHub项目圈选17』推荐5款本周 火火火 的AI开源项目
『GitHub项目圈选17』推荐5款本周 火火火 的AI开源项目
298 1
|
2月前
|
机器学习/深度学习 人工智能 API
『GitHub项目圈选06』推荐5款本周 超火 的开源AI项目
『GitHub项目圈选06』推荐5款本周 超火 的开源AI项目
119 0
|
2月前
|
数据采集 人工智能 Rust
『GitHub项目圈选周刊01』一款构建AI数字人项目开源了!自动实现音视频同步!
『GitHub项目圈选周刊01』一款构建AI数字人项目开源了!自动实现音视频同步!
311 0
|
1月前
|
人工智能 运维 Kubernetes
ACK AI 助手 beta 版现已全面上线
ACK AI 助手 beta 版现已全面上线
16 3
|
2月前
|
人工智能 监控 算法
java智慧城管源码 AI视频智能分析 可直接上项目
Java智慧城管源码实现AI视频智能分析,适用于直接部署项目。系统运用互联网、大数据、云计算和AI提升城市管理水平,采用“一级监督、二级指挥、四级联动”模式。功能涵盖AI智能检测(如占道广告、垃圾处理等)、执法办案、视频分析、统计分析及队伍管理等多个模块,利用深度学习优化城市管理自动化和智能化,提供决策支持。
255 4
java智慧城管源码 AI视频智能分析 可直接上项目
|
6天前
|
人工智能 安全 Java
安利一个我喜欢的博主(鱼皮)的项目----鱼聪明AI
安利一个我喜欢的博主(鱼皮)的项目----鱼聪明AI
15 0
|
10天前
|
人工智能 自然语言处理 算法
分享几个.NET开源的AI和LLM相关项目框架
分享几个.NET开源的AI和LLM相关项目框架
|
18天前
|
人工智能 移动开发 小程序
uniapp框架——vue3+uniFilePicker+fastapi实现文件上传(搭建ai项目第二步)
uniapp框架——vue3+uniFilePicker+fastapi实现文件上传(搭建ai项目第二步)
51 2
|
18天前
|
人工智能 小程序 前端开发
uniapp框架——初始化vue3项目(搭建ai项目第一步)
uniapp框架——初始化vue3项目(搭建ai项目第一步)
27 1
|
27天前
|
人工智能 程序员 开发工具
“AI 程序员入职系列”第二弹:如何利用通义灵码光速改写项目编程语言?
本文中阿里云后端工程师云徊将从项目开发的实际需求出发,演示通义灵码在开发工作中可提供的帮助。