DataWhale夏令营第四期魔搭- AIGC方向task01笔记

本文涉及的产品
模型训练 PAI-DLC,100CU*H 3个月
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: DataWhale夏令营,AIGC方向task1笔记。从平台注册到程序调试,最终生成一组古风小故事图片,并对其进行总结分析。

DataWhale夏令营第四期魔搭- AIGC方向task01笔记
part1 前序工作准备
这里教程和助教的笔记写的挺详细的,就不过多赘述了,整体只需要跟着操作即可。唯一只有两个点需要注意:
一是阿里云的PAI-DSW每天只有500个新用户试用名额,超过名额或者不是新用户就试用不了了。如果新用户当天没有抢到这500名额,就不要按后续的教程急急忙忙在阿里云中创建实例。因为一旦使用了阿里云的PAI-DSW,就不是新用户了,哪怕等到第二天名额刷新也无法领取赠送的5000CU*H 3个月,如下图:
image.png

如果没领到试用资源,这里推荐先去使用ModelScope社区给新用户赠送的100h(如下图),后续再取尝试领取阿里赠送的资源。
image.png

part2 程序调试
jupyter的使用大家基本也都会,按照教程实例跟着走就好。用到的包和资源下的也都很快,等待过程中可以通过左上角的标识来分辨是否在运行,变成绿色的运行完成就可以开始下一个了。image.png

参数设置要考虑合理性,太大不仅会使训练时间大大增加,还有爆显存的可能性。这里lora_rank设置的是16,一般都是8的倍数,8,16,32,64等。image.png

图片的提示词prompt可以自定义,一般采用描述性的词语或短语,可以也使用一些短句。描述时要注意连续性,并保证不同图片之间词语的相同/相近,以此保证不同图片间的关联性。
在这里我希望绘制出一个古代女侠客在客栈住宿的故事,故以此扩展,写出8幅图片的提示词。
image.png
image.png

part3 结果生成
提示词完成之后便可以运行数据集进行训练了,并用训练结果生成目标图像:
1.jpg
3.jpg
6.jpg
2.jpg
4.jpg
5.jpg
8.jpg
7.jpg

part4 总结分析
总体来看完成了ai图片的生成,并且生成的图片按需具有一定的故事性和连贯性,也没有太大的不合理特征,这一点算是成功的。但如果细看就会发现还是有一些逻辑性问题:女侠佩剑长度和款式会发生变化(例如p7和p8),面部特征也会有所出入)(例如p1和其他图图片)。个人猜测是整体的连贯性和特征描述不够,后续应该对提示词多进行一些斟酌和修改,以减少类似的逻辑问题。
橙少东2024.8.8

目录
相关文章
|
7月前
|
数据采集 机器学习/深度学习 人工智能
Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1笔记
这段内容介绍了一个使用Stable Diffusion与LoRA技术创建定制化二次元图像生成模型的全流程。首先,通过安装必要的软件包如Data-Juicer和DiffSynth-Studio准备开发环境。接着,下载并处理二次元图像数据集,利用Data-Juicer进行数据清洗和筛选,确保图像质量和尺寸的一致性。随后,训练一个针对二次元风格优化的LoRA模型,并调整参数以控制模型复杂度。完成训练后,加载模型并通过精心设计的提示词(prompt)生成一系列高质量的二次元图像,展示模型对细节和艺术风格的理解与再现能力。整个过程展示了从数据准备到模型训练及结果生成的完整步骤,为定制化图像提供了方向。
|
7月前
|
人工智能
DataWhale AI夏令营 第四期魔搭- 大模型应用全栈开发task01笔记
DataWhale AI夏令营 第四期魔搭- 大模型应用全栈开发task01笔记
98 0
|
7月前
|
人工智能
Datawhale X 魔搭 AI夏令营task 2笔记
Datawhale X 魔搭 AI夏令营task 2笔记
87 1
Datawhale X 魔搭 AI夏令营task 2笔记
|
7月前
|
数据采集 人工智能 物联网
Datawhale X 魔搭 AI夏令营task 3笔记
Datawhale X 魔搭 AI夏令营task 3笔记
123 2
|
7月前
|
人工智能 算法 开发者
「天池AI IP形象征集大赛」重磅上线,天池平台Al形象由你来创造!
聚首十年,以文生景,靠想象勾勒非凡,更有丰厚参赛奖励!
|
7月前
|
人工智能 自然语言处理 量子技术
👑生成式大模型王者之路:掌握提示词工程,让你的创意称霸AI界👑
【8月更文挑战第1天】在AI领域,生成式大模型正引领新潮流。然而,驾驭这些模型的关键在于提示词工程。初学者的提示词往往简单直白,激发的基础内容缺乏特色;而高手能构建具启发性的提示词,引导模型挖掘创意潜力。模糊提示词让模型难以把握重点,精准提示词则如导航,明确方向与目标。例如,从“写篇未来文章”到详细指定时间、地点与技术背景,后者促使模型生成更具体深入的内容。掌握提示词工程,让你在AI创意领域独领风骚。
108 0
|
9月前
|
机器学习/深度学习 JSON 人工智能
「寻找热爱技术创作的你:写下你在技术探中的实践和思考」 零一万物大模型开放平台 第四天 我爱我园
在PowerShell中,由于安全策略,直接使用curl命令(实为`Invoke-WebRequest`别名)从特定URL请求数据时,可能出现错误。修正后的`Invoke-RestMethod`示例展示了如何向API发送POST请求,包含授权头、JSON体,并处理返回的数据。尽管成功展示了如何描述一张图片,但尝试对网上.html格式的图片进行分析时失败,因为需要的是可直接访问的网络图片URL。
「寻找热爱技术创作的你:写下你在技术探中的实践和思考」 零一万物大模型开放平台  第四天  我爱我园
|
9月前
|
JSON 数据格式
「寻找热爱技术创作的你:写下你在技术探中的实践和思考」零一万物大模型开放平台 第三天 我爱我园
```markdown 零一万物大模型开放平台中,使用RAG模型进行HTTP POST请求交互,查询洛杉矶天气。请求成功(Status 200),但响应内容未提供天气信息,可能因JSON数据省略或格式问题导致答案缺失。 ```
|
机器学习/深度学习 人工智能 算法
成为第一没有捷径:AI新势力MindSpore成长秘籍 | 源创者说 专访开源专家胡晓曼
成为第一没有捷径:AI新势力MindSpore成长秘籍 | 源创者说 专访开源专家胡晓曼
460 0
社区供稿 | 魔搭Agent创意挑战赛作品体验感受
近期在闲逛知乎时看到魔搭发起了一个Agent创新应用比赛,看了下奖金还挺高的呀( •̀ ω •́ )y

热门文章

最新文章