接上篇:https://developer.aliyun.com/article/1621177?spm=a2c6h.13148508.setting.16.45bd4f0eTQyTls
启动项目
恭喜你顺利配置了环境,我们继续!
使用 gui.sh
启动项目
./gui.sh --listen 0.0.0.0 --server_port 6006 --share • 1
访问项目
# 或者是你的 IP 地址 http://localhost:6006 • 1 • 2
我们可以看到项目的大致页面为:
准备素材
下载素材
我去网络上截图了不到20张小樱,按理来说,图片越多,风格样式不一样,可以帮助模型更好的学习到特征。
统一裁切
这里为了保证模型更好的学习,建议裁切到统一大小,同时把20张都手动过一遍。(不裁切的话,工具可以自行进行识别和裁切,裁切模型认为好的那部分)
一键裁切为标准的尺寸,我这里选择了 512x512
免费的裁切网站(感谢无私奉献):birme统一裁切
上传素材
用你习惯的方式,将图片上传到某个目录。(记住这个目录,后边要用到)
目录名要求:数字_项目名,我这里是:30_sakura,动漫风格10-50(可以搜索你要训练的风格配置为多少)
因为是学习,大家不用研究那么多,直接按30来就行,先抄着参数跑通再说。
这里大致样子是(忘记截图了,用了别的项目的图):
生成标签
打开项目地址(刚才的6006)标签页,并填写如下参数:
● Image foloder to caption 你上传图片的目录
● Prefix to add to BLIP caption 图片添加的前置词
我这里对应的两个参数地址是:
# 图片目录 Image foloder to caption /root/autodl-tmp/kohya_ss/wzk_test/image/30_sakura # 添加的前置词(类似于触发词,以后通过该词触发)Prefix to add to BLIP caption w_sakura
开始训练
点击Caption Images
开始训练,此时如果你是第一次运行,将会有一些额外的模型需要下载。
如果一切顺利的话,你将会看到模型给我们的图片打上了标签。
文件内变成了:图片+txt标签内容
此时我们可以针对每个txt
的内容,调整提示词,但是作为学习,暂时不考虑,我们优先
查看标签
# 000.txt w_sakura, a girl with a ponytail and a sailor outfit # 001.txt w_sakura, a girl with green eyes and a ponytail # 002.txt w_sakura, a girl with a bag of bread and a sandwich