基于Qwen-3B-Raw的本地化SD Prompt生成器研究

简介: 本项目用NLP技术把人类的模糊美学意图,蒸馏成可重复、可微调、可部署的图像生成指令引擎。

基于本地部署的Qwen2.5-3b-Raw模型的本地化SD Prompt生成器研究

寒假闲来无事想接触接触AI绘图领域看看能不能画几张美图来赚点生活费,无意中了解到在Linux系统下性能开销会有所降低,于是手动在本地的5070ti笔电上部署了Ubuntu双系统,在使用comfyUI的sdxl绘图模型期间,深感正负提示词的编写不易,往往想画出无毛糙高质感的图片光想并填写提示词就得花掉10分钟甚至更多的时间,尝试利用云端大模型时发现风格难以固定,适用sdxl clip编码器中的75token片区限制的能力较差,每次调试时也极具耗费心力。由此,我产生了本地部署个sd prompt生成器的想法,并通过云端大模型的代码编写能力逐步推进。


在推进伊始时,我根据本地的12GB显存限制选择了qwen2.5-7b-instruct模型,但在通过脚本限制规范其输出时发觉7b频繁出现添词,输出占位符甚至拒绝输出的情况,我通过网络了解到构建LoRA微调可以有效减少幻觉的产生,于是我利用了云端大模型编写了560条训练JSON,但效果不佳,且时常出现爆显存的状况,于是我重新选择了qwen2.5-3b-raw模型,我意识到这只是个语义蒸馏的过程,并不需要高精度模型的支撑,我由此得以正常开展对3b微调,我利用数学随机组合的方式生成的JSON有效覆盖了绝大多数场景,最终在alpha=64,loss=0.47的情况下构造了一个几乎接近可用的本地sd prompt语义联想生成器。

我现已开源该项目,我的GitHub库地址如下:https://github.com/LianHe-BI/Basic-Qwen-3B-SD-Prompt-SOUL-ARCHITECT-v2.0-DEMO


内含我现有的详细开发成果,想具体了解的朋友可以看一看,同时我希望各位大佬能给予相关指正,本人感激不尽,目前已经尝试拆解sdxl的生成逻辑并在开发3.0版本,3.0的基础构想如下:

用户输入:6分日常构思 4分奇幻荒诞(训练时由flash模型自行想象)

中文意境构思→在正负面形成结束后自然概括(暂不计入训练中,防范语义理解错乱)

正面提示:[(前:3或4分地基 中:5或4分牵引 后:2分灵魂) 总token~75]

反面提示:[(前固化矩阵5分 + 后动态演化 5分)总token~50]

利用qwen-plus训练1600条样本,反补本地qwen-3b loss训练跌至0.3~0.4收手

引入历史记录联想索引(未来)

目录
相关文章
|
10天前
|
人工智能 JavaScript Linux
【Claude Code 全攻略】终端AI编程助手从入门到进阶(2026最新版)
Claude Code是Anthropic推出的终端原生AI编程助手,支持40+语言、200k超长上下文,无需切换IDE即可实现代码生成、调试、项目导航与自动化任务。本文详解其安装配置、四大核心功能及进阶技巧,助你全面提升开发效率,搭配GitHub Copilot使用更佳。
|
4天前
|
JSON API 数据格式
OpenCode入门使用教程
本教程介绍如何通过安装OpenCode并配置Canopy Wave API来使用开源模型。首先全局安装OpenCode,然后设置API密钥并创建配置文件,最后在控制台中连接模型并开始交互。
1890 6
|
12天前
|
存储 人工智能 自然语言处理
OpenSpec技术规范+实例应用
OpenSpec 是面向 AI 智能体的轻量级规范驱动开发框架,通过“提案-审查-实施-归档”工作流,解决 AI 编程中的需求偏移与不可预测性问题。它以机器可读的规范为“单一真相源”,将模糊提示转化为可落地的工程实践,助力开发者高效构建稳定、可审计的生产级系统,实现从“凭感觉聊天”到“按规范开发”的跃迁。
1895 18
|
10天前
|
人工智能 JavaScript 前端开发
【2026最新最全】一篇文章带你学会Cursor编程工具
本文介绍了Cursor的下载安装、账号注册、汉化设置、核心模式(Agent、Plan、Debug、Ask)及高阶功能,如@引用、@Doc文档库、@Browser自动化和Rules规则配置,助力开发者高效使用AI编程工具。
1349 7
|
14天前
|
IDE 开发工具 C语言
【2026最新】VS2026下载安装使用保姆级教程(附安装包+图文步骤)
Visual Studio 2026是微软推出的最新Windows专属IDE,启动更快、内存占用更低,支持C++、Python等开发。推荐免费的Community版,安装简便,适合初学者与个人开发者使用。
1353 13
|
10天前
|
人工智能 JSON 自然语言处理
【2026最新最全】一篇文章带你学会Qoder编辑器
Qoder是一款面向程序员的AI编程助手,集智能补全、对话式编程、项目级理解、任务模式与规则驱动于一体,支持模型分级选择与CLI命令行操作,可自动生成文档、优化提示词,提升开发效率。
822 10
【2026最新最全】一篇文章带你学会Qoder编辑器
|
14天前
|
人工智能 测试技术 开发者
AI Coding后端开发实战:解锁AI辅助编程新范式
本文系统阐述了AI时代开发者如何高效协作AI Coding工具,强调破除认知误区、构建个人上下文管理体系,并精准判断AI输出质量。通过实战流程与案例,助力开发者实现从编码到架构思维的跃迁,成为人机协同的“超级开发者”。
1103 96
|
8天前
|
云安全 安全
免费+限量+领云小宝周边!「阿里云2026云上安全健康体检」火热进行中!
诚邀您进行年度自检,发现潜在风险,守护云上业务连续稳健运行
1182 2

热门文章

最新文章