Scepter Studio-万能图片生成工作台

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,100CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 一句“A cute girl”这样的提示词,到底在Scepter studio上可以生成多少张不同风格的图片?答案是:无限

可控AI,无限生成

一句“A cute girl”这样的提示词,到底在Scepter studio上可以生成多少张不同风格的图片?答案是:无限


SCEPTER 是一个开源代码存储库,致力于生成训练、微调和推理,包含一系列下游任务,例如图像生成、传输、编辑。它集成了流行的社区驱动的实现以及阿里巴巴集团通义实验室的方法,为 AIGC 领域的研究人员和从业者提供了全面的工具包。这个多功能库旨在促进快速发展的生成模型领域的创新和加速开发。


SCEPTER Studio,是一个基于Gradio的数据管理、模型训练和推理的集成工具包。


支持范围:

  • SD系列系列模型:SD-v1.5/SD-v2.1/SD-XL
  • 文本生成图片推理:使用咒语/使用微调/使用控制
  • 数据管理:支持从零新建数据集
  • 模型训练:支持全参数微调,lora,SCE,TEXT-SCE,TEXT_LORA等各种微调方式


开源地址:https://github.com/modelscope/scepter



魔搭社区最佳实践

0代码创空间体验

创空间体验地址:

https://modelscope.cn/studios/iic/scepter_studio/summary


创空间主要体验文本生成图片推理能力:

prompt:a cute girl

基础模型生成:


使用咒语书:选择可爱的3D角色风格


使用微调,微调模型是铅笔素描:


选择控制,openpose(目前控制仅支持SD-v2.1,SDXL正在训练中)


支持咒语,微调模型,控制器叠加使用,如下为可爱3D角色咒语和openpose可控生成叠加使用:


使用魔搭免费算力独占式部署Scepter Studio

环境配置与安装

  1. python 3.8及以上版本
  2. pytorch 1.12及以上版本,推荐2.0及以上版本
  3. 建议使用CUDA 11.4及以上

本文主要演示的模型推理代码可在魔搭社区免费实例PAI-DSW的配置下运行(显存24G) :


点击模型右侧Notebook快速开发按钮,选择GPU环境


新建Notebook


安装依赖库

pip install scepter==0.0.2

拉起Web-UI服务

#中文web-ui
python -m scepter.tools.webui --language zh
#英文web-ui
python -m scepter.tools.webui --language en

按照这种方式部署的web-ui支持数据管理和训练(需要40G显存)

image.png

更多详细使用说明,参考教学视频:

scepter_studio_train_inference 00_00_00-00_00_30.gif

相关文章
|
人工智能 安全
Stable Diffusion:网页版 体验 / AI 绘图
Stable Diffusion:网页版 体验 / AI 绘图
2466 0
|
机器学习/深度学习 编解码 人工智能
AI短视频制作一本通:文本生成视频、图片生成视频、视频生成视频
AI短视频制作一本通:文本生成视频、图片生成视频、视频生成视频
1546 0
|
人工智能 搜索推荐 物联网
InstantID:一张照片,无需训练,秒级个人写真生成
InstantID 是由InstantX项目组推出的一种SOTA的tuning-free方法,只需单个图像即可实现 ID 保留生成,并支持各种下游任务。
|
数据采集 存储 人工智能
TripoSR开源!从单个图像快速生成 3D 对象!(附魔搭社区推理实战教程)
近期,VAST团队和Stability AI团队合作发布了TripoSR,可在一秒内从单个图像生成高质量3D对象。
|
机器学习/深度学习 物联网 开发者
秒级生图,SDXL-turbo、LCM-SDXL魔搭社区最佳实践
最近一个月,快速生图成为文生图领域的热点,其中比较典型的两种方式的代表模型分别为SDXL-turbo 和 LCM-SDXL。
|
人工智能 物联网 开发者
让你拥有专属且万能的AI摄影师+AI修图师——FaceChain迎来最大版本更新
自8月11日开源了第一版本证件照后,FaceChain迎来了最大版本的更新,不仅集中上线了一波非常有用的功能,在gradio界面上也做了大幅度优化
|
机器学习/深度学习
基于PaddleGAN精准唇形合成模型实现美女表白视频
基于PaddleGAN精准唇形合成模型实现美女表白视频
1271 0
基于PaddleGAN精准唇形合成模型实现美女表白视频
|
前端开发 计算机视觉
InstantStyle,无需训练,风格保留文生图
InstantStyle 是一个通用框架,它采用两种简单但有效的技术来实现风格和内容与参考图像的有效分离。
|
11月前
|
人工智能 运维 Devops
CAP:Serverless + AI 让应用开发更简单
对于众多开发者而言,Serverless 架构的核心优势在于其能够无缝集成多种云产品与组件,从而使得开发者可以更加专注于核心业务逻辑和创新。此外,Serverless 架构还提供了按量付费的灵活计费模式,进一步降低了资源成本。使用云应用开发平台 CAP,在 AI 领域,企业就可以专注于模型训练、算法优化等关键任务,让 AI 应用的开发、部署以及全生命周期的管理更加简单。可以预见 Serverless 技术将催生一系列创新且有趣的应用,而这些应用将不断拓展 AI 技术的边界。
|
机器学习/深度学习 人工智能 分布式计算
使用PAI+LLaMA Factory 微调 Qwen2-VL 模型,搭建文旅领域知识问答机器人
本次教程介绍了如何使用 PAI ×LLaMA Factory 框架,基于全参方法微调 Qwen2-VL 模型,使其能够进行文旅领域知识问答,同时通过人工测试验证了微调的效果。
使用PAI+LLaMA Factory 微调 Qwen2-VL 模型,搭建文旅领域知识问答机器人

热门文章

最新文章