“一丹一世界”三等奖 | 木刻时光·细密风 经验分享

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,100CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: “一丹一世界”三等奖 | 木刻时光·细密风 经验分享

image.png

作者:老无谈藏书票

模型使用说明:

1.在提示词中需要说明”黑白木刻“,对应的英文提示是”woodcut print,black and white“等字样。

2.生成提示词后,使用”提示词优化“的选项,生图效果更好。

3.一般一次生成 4 张,就能挑选出满意的作品。

4.如果效果不好,可以调整提示词,目前个人试验,各类场景(神话、日常生活、风景、动物等)都能达到较好效果。

炼丹过程

此版本为针对黑白木刻风格进行 Lora 微调的第三代模型,相较于初代版本,在细节刻画与泛化能力上均有显著提升。

在第一版模型的开发中,我们以试验性的心态起步。然而,初版模型由于训练数据有限,效果未能达到预期。在第二版中,我们扩充了数据集,却因图片风格差异过大,导致训练效果不佳。分析原因后,我们推测是训练数据的多样性与质量未能达到要求。于是,我们对数据集进行了优化,剔除了质量欠佳的图片,并增添了风格相近但细节更丰富的图片。同时,我们将前代模型生成的部分优质图片融入数据集中,进一步丰富了训练素材。

在数据准备过程中,我们深刻认识到图片标签的重要性。早期版本中,由于部分标签由智能工具自动生成,存在诸多错误,导致模型训练出现偏差。例如,一张图片中狗趴在树上,智能标签却未能准确识别,将狗误判为树干的一部分。为此,我们对每张图片的标签进行了细致的手动调整,确保标签的准确性,从而大幅提升了模型训练效果。

在模型训练完成后,我们发现提示词对生图效果有着关键性的影响。我们通常先利用 Deepseek 生成初步提示词,再结合魔塔的提示词优化功能进行调整,一般经过两轮优化即可获得较为理想的效果。

尽管当前版本已具备一定的实用性,但仍存在较大的提升空间。未来的工作方向包括:

  1. 拓展训练数据:在保持风格一致的前提下,纳入更多样化的图片,覆盖更广泛的场景。
  2. 精细化标签:在标签中融入版画技法信息,如圆刀、三角刀、平刀等,使模型能够学习技法细节。
  3. 风格融合创新:尝试引入不同风格的数据,探索创新风格的可能性。
  4. 模型参数优化:对模型训练的具体参数进行更细致的调整,以进一步提升模型性能。
  5. 底座模型替换:尝试更换其他底座模型,评估其对生成效果的影响。



目录
相关文章
|
1月前
|
机器学习/深度学习 人工智能 监控
实战 | Qwen3大模型微调入门实战(完整代码)
Qwen3是阿里通义实验室最近开源的大语言模型,发布时便登顶了开源LLM榜单第一名。同时,Qwen系列模型也超越LLaMA,成为了开源模型社区中最受欢迎的开源LLM。
1355 23
|
1月前
|
机器学习/深度学习 数据采集 安全
MiMo-7B:从预训练到强化学习,解锁语言模型的推理潜能
目前,大多数成功的 强化学习 工作,包括开源研究,都依赖于相对较大的基础模型,例如 32B 模型,特别是在增强代码推理能力方面。业内普遍认为在一个小模型中同时提升数学和代码能力是具有挑战性的。然而,小米MiMo研究团队相信 RL 训练的推理模型的有效性取决于基础模型固有的推理潜力。为了完全解锁语言模型的推理潜力,不仅需要关注后训练,还需要针对推理定制预训练策略。
244 43
|
1月前
|
数据可视化 API Swift
全模态图像模型Nexus-Gen对齐GPT-4o!同时搞定,数据、训练框架、模型全面开源
OpenAI GPT-4o发布强大图片生成能力后,业界对大模型生图能力的探索向全模态方向倾斜,训练全模态模型成研发重点。
164 17
|
1月前
|
Web App开发 人工智能 JSON
Windows版来啦!Qwen3+MCPs,用AI自动发布小红书图文/视频笔记!
上一篇用 Qwen3+MCPs实现AI自动发小红书的最佳实践 有超多小伙伴关注,同时也排队在蹲Windows版本的教程。
324 1
|
1月前
|
人工智能 API 开发者
用Qwen3+MCPs实现AI自动发布小红书笔记!支持图文和视频
魔搭自动发布小红书MCP,是魔搭开发者小伙伴实现的小红书笔记自动发布器,可以通过这个MCP自动完成小红书标题、内容和图片的发布。
762 41
|
30天前
|
机器学习/深度学习 开发框架 数据可视化
B站开源SOTA动画视频生成模型 Index-AniSora!
B站升级动画视频生成模型Index-AniSora技术并开源,支持番剧、国创、漫改动画、VTuber、动画PV、鬼畜动画等多种二次元风格视频镜头一键生成!
262 32
|
2月前
|
算法 物联网 Swift
Qwen3 X ModelScope工具链: 飞速训练 + 全面评测
Qwen于近日发布了Qwen3系列模型,包含了各个不同规格的Dense模型和MoE模型。开源版本中,Dense模型基本沿用了之前的模型结构,差别之处在于对于Q和K两个tensor增加了RMSNorm;MoE模型去掉了公共Expert,其他结构基本与前一致。在模型大小上,涵盖了从0.6B到32B(Dense)和235B(MoE)不同的尺寸。
225 15
|
27天前
|
人工智能 测试技术 API
通义灵码 + 魔搭MCP:全流程构建创空间应用
最近,通义灵码上线 MCP(ModelScope Cloud Platform)功能,从之前代码生成及修改的基础功能,到可以使用MCP服务连接更多功能,开发者可以实现从 代码爬取、模型推理到应用部署
434 26
|
1月前
|
人工智能 自然语言处理 搜索推荐
魔搭社区模型速递(4.27-5.10)
🙋魔搭ModelScope本期社区进展:📟2341个模型,206个数据集,🎨224个创新应用,📄 15篇内容
259 20
|
1月前
|
机器学习/深度学习 人工智能 机器人
魔搭社区模型速递(5.11-5.17)
🙋魔搭ModelScope本期社区进展:📟1656个模型,151个数据集,645个创新应用,📄 9 篇内容
198 11

热门文章

最新文章