ComfyUI支持OpenAI图像模型GPT-Image-1

高级教程
4月30日
编辑

Comfyui爱好者免费资源

AGI (All Ghibli Images，所有吉卜力风格图像) 即将来到您的 ComfyUI ！

OpenAI于4月24日正式公布了GPT-Image-1 API（与 ChatGPT 4o 图像模型背后的模型相同）。ComfyUI官方也宣布ComfyUI 现在通过ComfyUI官方的原生 API 节点（Beta 版）支持最新的 OpenAI 图像生成模型——允许您直接在节点图中访问最先进的功能，而无需复杂的 API 密钥。

ComfyUI支持OpenAI图像模型GPT-Image-1

此功能目前处于 Beta 测试阶段，ComfyUI官方正在开放以供早期实验。

什么是 GPT-Image-1？

OpenAI 的旗舰多模态模型，是 GPT-4o 的幕后功臣：

支持 3 种图像尺寸：方形 (1024×1024)、纵向 (1024×1536)、横向 (1536×1024) 和自动
三种质量级别：低、中、高
支持 ComfyUI 中的透明背景和蒙版图像编辑

要试用此集成，您需要注册/登录您的 Comfy Org 帐户。这是必需的，因为该模型通过 OpenAI 的付费 API 服务运行。API 集成是可选的，专为访问外部模型而设计。

ComfyUI 将始终对本地用户完全开源且免费。

开始使用

更新 ComfyUI 或 Desktop 到最新版本。
登录： 要使用 API 节点，您需要登录。转到 Settings → User → Login。没有帐户？点击 Create New Account。
充值： Settings → Credits → Buy Credits。ComfyUI官方使用预付费模式，积分仅在每次运行时消耗。没有意外收费。
将“OpenAI GPT Image 1”节点添加到您的画布并运行！

ComfyUI支持OpenAI图像模型GPT-Image-1

通过添加“Load Image”节点启用图像输入和蒙版编辑。

工作流展示

现在最令人兴奋的用例之一是将强大的外部模型（如 gpt-image-1）与现有的本地模型和本地工作流程相结合。

在此示例工作流程中，ComfyUI官方使用 OpenAI 的图像生成 API 从图像输入和文本提示创建了一个重新设计的图像，然后将其传递给本地 ComfyUI Wan2.1 图像到视频或 Wan2.1 VACE 控制视频生成工作流程。

GPT Image 1 + Wan2.1 I2V 工作流

ComfyUI支持OpenAI图像模型GPT-Image-1

GPT Image 1 + Wan2.1 VACE Control 工作流

ComfyUI支持OpenAI图像模型GPT-Image-1

Token 成本和质量选项

输入：每 100 万文本 token 5 美元，每 100 万图像 token 10 美元。
输出：每 100 万图像 token 40 美元，与 OpenAI 的定价相同。
价格：https://platform.openai.com/docs/pricing

按分辨率和质量划分的 Token 成本：

分辨率	质量	估计输出 Token	估计成本
1024x1024	低	~11,000	~$0.44
1024x1024	中	~35,000	~$1.40
1024x1024	高	~100,000	~$4.00
1024x1536/1536x1024	低	~16,500	~$0.66
1024x1536/1536x1024	中	~52,500	~$2.10
1024x1536/1536x1024	高	~150,000	~$6.00