Scepter Studio-万能图片生成工作台

简介: 一句“A cute girl”这样的提示词,到底在Scepter studio上可以生成多少张不同风格的图片?答案是:无限

可控AI,无限生成

一句“A cute girl”这样的提示词,到底在Scepter studio上可以生成多少张不同风格的图片?答案是:无限


SCEPTER 是一个开源代码存储库,致力于生成训练、微调和推理,包含一系列下游任务,例如图像生成、传输、编辑。它集成了流行的社区驱动的实现以及阿里巴巴集团通义实验室的方法,为 AIGC 领域的研究人员和从业者提供了全面的工具包。这个多功能库旨在促进快速发展的生成模型领域的创新和加速开发。


SCEPTER Studio,是一个基于Gradio的数据管理、模型训练和推理的集成工具包。


支持范围:

  • SD系列系列模型:SD-v1.5/SD-v2.1/SD-XL
  • 文本生成图片推理:使用咒语/使用微调/使用控制
  • 数据管理:支持从零新建数据集
  • 模型训练:支持全参数微调,lora,SCE,TEXT-SCE,TEXT_LORA等各种微调方式


开源地址:https://github.com/modelscope/scepter



魔搭社区最佳实践

0代码创空间体验

创空间体验地址:

https://modelscope.cn/studios/iic/scepter_studio/summary


创空间主要体验文本生成图片推理能力:

prompt:a cute girl

基础模型生成:


使用咒语书:选择可爱的3D角色风格


使用微调,微调模型是铅笔素描:


选择控制,openpose(目前控制仅支持SD-v2.1,SDXL正在训练中)


支持咒语,微调模型,控制器叠加使用,如下为可爱3D角色咒语和openpose可控生成叠加使用:


使用魔搭免费算力独占式部署Scepter Studio

环境配置与安装

  1. python 3.8及以上版本
  2. pytorch 1.12及以上版本,推荐2.0及以上版本
  3. 建议使用CUDA 11.4及以上

本文主要演示的模型推理代码可在魔搭社区免费实例PAI-DSW的配置下运行(显存24G) :


点击模型右侧Notebook快速开发按钮,选择GPU环境


新建Notebook


安装依赖库

pip install scepter==0.0.2

拉起Web-UI服务

#中文web-ui
python -m scepter.tools.webui --language zh
#英文web-ui
python -m scepter.tools.webui --language en

按照这种方式部署的web-ui支持数据管理和训练(需要40G显存)

image.png

更多详细使用说明,参考教学视频:

scepter_studio_train_inference 00_00_00-00_00_30.gif

相关文章
|
人工智能 安全
Stable Diffusion:网页版 体验 / AI 绘图
Stable Diffusion:网页版 体验 / AI 绘图
3093 0
|
机器学习/深度学习 编解码 人工智能
AI短视频制作一本通:文本生成视频、图片生成视频、视频生成视频
AI短视频制作一本通:文本生成视频、图片生成视频、视频生成视频
3037 0
|
2月前
|
数据采集 自然语言处理 监控
你的模型真的“学”会了吗?微调效果评估实战指南
本文系统讲解大模型微调效果评估的核心方法论:强调评估比训练更重要,涵盖目标对齐、技术指标(Loss/PPL/BLEU/ROUGE)、人工评估四维度、业务验证(A/B测试、端到端场景)、泛化性检验及四步实战流程,并提供避坑指南与工具建议。重在目标驱动、多层验证、快速闭环。(239字)
334 1
|
数据安全/隐私保护 开发者 异构计算
阿里巴巴开源可控视频生成框架VideoComposer!(内含体验、推理实践干货)
8月16日,时间、空间可控的视频生成模型 VideoComposer 在魔搭社区开源。
阿里巴巴开源可控视频生成框架VideoComposer!(内含体验、推理实践干货)
|
人工智能 搜索推荐 物联网
InstantID:一张照片,无需训练,秒级个人写真生成
InstantID 是由InstantX项目组推出的一种SOTA的tuning-free方法,只需单个图像即可实现 ID 保留生成,并支持各种下游任务。
|
人工智能 物联网 开发者
让你拥有专属且万能的AI摄影师+AI修图师——FaceChain迎来最大版本更新
自8月11日开源了第一版本证件照后,FaceChain迎来了最大版本的更新,不仅集中上线了一波非常有用的功能,在gradio界面上也做了大幅度优化
|
前端开发 计算机视觉
InstantStyle,无需训练,风格保留文生图
InstantStyle 是一个通用框架,它采用两种简单但有效的技术来实现风格和内容与参考图像的有效分离。
|
11月前
|
机器学习/深度学习 人工智能 算法
大型多模态推理模型技术演进综述:从模块化架构到原生推理能力的综合分析
该研究系统梳理了大型多模态推理模型(LMRMs)的技术发展,从早期模块化架构到统一的语言中心框架,提出原生LMRMs(N-LMRMs)的前沿概念。论文划分三个技术演进阶段及一个前瞻性范式,深入探讨关键挑战与评估基准,为构建复杂动态环境中的稳健AI系统提供理论框架。未来方向聚焦全模态泛化、深度推理与智能体行为,推动跨模态融合与自主交互能力的发展。
893 13
大型多模态推理模型技术演进综述:从模块化架构到原生推理能力的综合分析
|
机器学习/深度学习 人工智能 计算机视觉
AI图像质感还原堪比专业摄影!Miracle F1:美图WHEE全新AI图像生成模型,支持超写实与多风格生成
美图WHEE推出的Miracle F1采用扩散模型技术,通过精准语义理解和多风格生成能力,可产出具有真实光影质感的专业级图像作品。
580 5
AI图像质感还原堪比专业摄影!Miracle F1:美图WHEE全新AI图像生成模型,支持超写实与多风格生成
|
人工智能 并行计算 测试技术
从商业海报到二次元插画多风格通吃!HiDream-I1:智象未来开源文生图模型,17亿参数秒出艺术大作
HiDream-I1是智象未来团队推出的开源图像生成模型,采用扩散模型技术和混合专家架构,在图像质量、提示词遵循能力等方面表现优异,支持多种风格生成。
1118 2
从商业海报到二次元插画多风格通吃!HiDream-I1:智象未来开源文生图模型,17亿参数秒出艺术大作

热门文章

最新文章

下一篇
开通oss服务