【ComfyUI API 自动化利器:comfyui_xy Python 库使用详解】

简介: `comfyui_xy` 是一个轻量级 Python 客户端库,封装 ComfyUI API,支持一键上传图片/遮罩、动态修改工作流、自动排队执行与结果下载(图/视/音频)。安装即用,无需处理底层 HTTP/WebSocket 细节,助力 AIGC 自动化开发。开源免费,PyPI 可装。

项目地址https://github.com/xy200303/ComfyUiApi

PyPI地址https://pypi.org/project/comfyui-xy/

在 AIGC 领域,ComfyUI 凭借其强大的节点式工作流赢得了众多开发者的青睐。然而,当我们需要将 ComfyUI 集成到自己的应用中,或者进行批量化、自动化任务时,直接使用官方 API 可能会显得有些繁琐。

为了解决这个问题,我开发了一个轻量级的 Python 客户端库 —— comfyui_xy。它封装了 ComfyUI 的核心 API,让你能够像调用普通 Python 函数一样,轻松实现上传图片、修改工作流、排队任务以及获取生成结果。

本文将详细介绍 comfyui_xy 的安装与使用方法,带你快速上手 ComfyUI 自动化。


1. 安装

首先,通过 pip 安装该库:

pip install comfyui_xy

2. 快速入门

2.1 准备工作:获取 API 格式工作流

在使用 API 之前,你需要获取 ComfyUI 的工作流 JSON。注意:这与平时保存的 JSON 不同。

  1. 打开 ComfyUI 网页界面。
  2. 点击菜单中的 Settings(齿轮图标)。
  3. 勾选 "Enable Dev mode Options"
  4. 回到菜单,点击 "Save (API Format)" 按钮,保存为 workflow_api.json

2.2 最简示例:文生图

下面是一个简单的示例,展示如何加载工作流并生成图片。

import json
import random
from comfyui_api import ComfyUiClient

# 1. 初始化客户端 (默认连接本地 http://127.0.0.1:8188)
client = ComfyUiClient()

# 2. 加载你导出的 API 格式工作流
with open("workflow_api.json", "r", encoding="utf-8") as f:
    workflow = json.load(f)

# 3. 动态修改参数
# 假设 KSampler 是节点 "3",我们要修改它的 seed
workflow["3"]["inputs"]["seed"] = random.randint(1, 1000000000)

# 4. 执行工作流
# process_workflow 会自动排队、等待执行完成、并下载结果
print("正在执行任务...")
results = client.process_workflow(workflow)

# 5. 保存结果
for i, result in enumerate(results):
    print(f"生成文件: {result.filename} ({result.file_type})")
    result.save(f"output_{i}.png") # 保存到本地

    if result.file_type == "image":
        result.show() # 如果是图片,直接弹出预览

3. 核心功能详解

3.1 连接远程服务器

如果你的 ComfyUI 部署在远程服务器(例如 AutoDL 或云服务器),支持 HTTPS:

# 连接远程 HTTPS 服务器
client = ComfyUiClient(url="https://u12345.autodl.com:12345")

# 或者普通的 HTTP 服务器
# client = ComfyUiClient(url="http://192.168.1.100:8188")

3.2 图生图:上传图片与遮罩

在图生图(Img2Img)或重绘(Inpainting)任务中,我们需要先上传图片。

# 上传图片
image_name = client.upload_image("test.jpg")
print(f"图片已上传,服务器文件名为: {image_name}")

# 上传遮罩
mask_name = client.upload_mask("mask.png")

# 将上传后的文件名填入工作流节点
# 假设 LoadImage 节点 ID 为 "10"
workflow["10"]["inputs"]["image"] = image_name

3.3 处理多种输出类型

ComfyUI 不仅生成图片,还可能生成视频(AnimateDiff)、音频等。comfyui_xy 统一使用 ComfyResponse 对象处理这些结果。

results = client.process_workflow(workflow)

for result in results:
    # result.data: 原始二进制数据
    # result.file_type: 'image', 'video', 'audio' 等

    if result.file_type == "video":
        result.save("output_video.mp4")
    elif result.file_type == "image":
        result.save("output_image.png")

3.4 高级控制

库中还封装了一些常用的系统级操作:

  • 中断任务
    client.interrupt()
    
  • 查看队列
    queue_info = client.get_queue()
    print(f"排队中: {queue_info['queue_pending']}, 运行中: {queue_info['queue_running']}")
    
  • 获取历史记录
    history = client.get_history_all()
    
  • 查询节点信息
    # 获取 KSampler 的输入输出定义
    info = client.get_object_info("KSampler")
    

4. 总结

comfyui_xy 旨在简化 Python 与 ComfyUI 的交互过程,让你无需处理复杂的 WebSocket 连接和 HTTP 请求细节。无论是构建自己的 AI 应用后端,还是编写自动化测试脚本,它都能助你一臂之力。

项目开源地址https://github.com/xy200303/ComfyUiApi

如果你觉得好用,欢迎给个 Star!如果有任何问题,也欢迎在 Issues 中反馈。

相关文章
|
5月前
|
并行计算 PyTorch 开发工具
ComfyUI 安装踩坑全记录:Python 版本冲突、CUDA 报错、GitHub 拉取失败如何解决
本文详述Windows下ComfyUI环境配置的典型“雪崩式”故障:Python多版本冲突(3.10/3.11/3.14)、CUDA与PyTorch错配、启动器脱离venv、Git失效及GitHub插件(Impact-Pack/SAM2)因网络不稳定反复拉取失败。核心揭示——问题根源不在技术细节,而在各工具对“干净系统”的隐含假设彼此冲突。全文聚焦实操解法:强制指定venv路径、精准安装cu121版PyTorch、独立配置Git代理,并强调“信venv、不信系统Python”的关键原则。助力新手快速避坑、稳态运行。(239字)
|
9月前
|
存储 人工智能 Serverless
FunctionAI 图像生成:简化从灵感到 API 调用的每一步
FunctionAI 图像生成服务助力企业突破AI图像应用的三大难题:高成本算力、复杂运维与工程化壁垒。基于Serverless架构,提供从项目开发到API调用的全生命周期管理,支持ComfyUI、Stable Diffusion等主流工具,实现“一键部署、秒级调试、快速上线”。弹性伸缩、按需付费,大幅降低成本;国内网络加速、模型缓存、安全隔离,保障高效与稳定。让创意从灵感到生产无缝转化,真正驱动业务增长。
|
8月前
|
监控 JavaScript 编译器
从“天书”到源码:HarmonyOS NEXT 崩溃堆栈解析实战指南
本文详解如何利用 hiAppEvent 监控并获取 sourcemap、debug so 等核心产物,剖析了 hstack 工具如何将混淆的 Native 与 ArkTS 堆栈还原为源码,助力开发者掌握异常分析方法,提升应用稳定性。
994 94
|
5月前
|
编解码 物联网 测试技术
FLUX.2-Klein 4B/9B开源:亚秒级统一图像生成与编辑
Black Forest Labs开源FLUX.2 [klein]模型家族,兼具文生图、图像编辑与多参考生成能力,端到端推理低至0.5秒,4B版本仅需13GB显存,支持消费级GPU高效运行,量化后速度提升最高2.7倍,Apache 2.0许可商用友好。
3706 1
|
3月前
|
编解码 物联网 数据处理
LTX-2.3开源: 视频生成引擎级升级
Lightricks开源LTX-2.3音视频大模型:重建VAE提升细节锐度,文本连接器扩容4倍增强Prompt遵循,大幅优化I2V运动自然性与音频质量,并首次原生支持1080×1920竖版视频生成。22B参数,支持文生视频、图生视频等多任务。
4787 4
存储 人工智能 Serverless
771 35
|
8月前
|
测试技术
哪里不对改哪里!全能图像编辑模型Qwen-Image-Edit来啦
Qwen-Image-Edit基于20B Qwen-Image模型,融合视觉语义与外观控制,支持中英文文字精准编辑、风格迁移、IP创作等多重功能,具备SOTA性能,助力低门槛、高精度图像编辑。
3980 23
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
Z-Image:冲击体验上限的下一代图像生成模型
通义实验室推出全新文生图模型Z-Image,以6B参数实现“快、稳、轻、准”突破。Turbo版本仅需8步亚秒级生成,支持16GB显存设备,中英双语理解与文字渲染尤为出色,真实感和美学表现媲美国际顶尖模型,被誉为“最值得关注的开源生图模型之一”。
5244 9
|
3月前
|
存储 人工智能 Serverless
替换一个节点,ComfyUI 瞬间起飞
FunArt是阿里云函数计算推出的ComfyUI一键托管平台,集成VisionPlaid等高性能DiT推理引擎,支持多卡序列并行、4-bit量化与异步Offload,在保持原生兼容前提下显著加速图像/视频生成,真正实现开箱即用、弹性高可用的AI生成服务。

热门文章

最新文章