AGI (All Ghibli Images,所有吉卜力风格图像) 即将来到您的 ComfyUI !
OpenAI于4月24日正式公布了GPT-Image-1 API(与 ChatGPT 4o 图像模型背后的模型相同)。ComfyUI官方也宣布ComfyUI 现在通过ComfyUI官方的原生 API 节点(Beta 版)支持最新的 OpenAI 图像生成模型——允许您直接在节点图中访问最先进的功能,而无需复杂的 API 密钥。
此功能目前处于 Beta 测试阶段,ComfyUI官方正在开放以供早期实验。
什么是 GPT-Image-1?
OpenAI 的旗舰多模态模型,是 GPT-4o 的幕后功臣:
-
支持 3 种图像尺寸:方形 (1024×1024)、纵向 (1024×1536)、横向 (1536×1024) 和自动 -
三种质量级别:低、中、高 -
支持 ComfyUI 中的透明背景和蒙版图像编辑
要试用此集成,您需要注册/登录您的 Comfy Org 帐户。这是必需的,因为该模型通过 OpenAI 的付费 API 服务运行。API 集成是可选的,专为访问外部模型而设计。
ComfyUI 将始终对本地用户完全开源且免费。
开始使用
- 更新 ComfyUI 或 Desktop 到最新版本。
- 登录: 要使用 API 节点,您需要登录。转到 Settings → User → Login。没有帐户?点击 Create New Account。
- 充值: Settings → Credits → Buy Credits。ComfyUI官方使用预付费模式,积分仅在每次运行时消耗。没有意外收费。
- 将“OpenAI GPT Image 1”节点添加到您的画布并运行!
- 通过添加“Load Image”节点启用图像输入和蒙版编辑。
工作流展示
现在最令人兴奋的用例之一是将强大的外部模型(如 gpt-image-1)与现有的本地模型和本地工作流程相结合。
在此示例工作流程中,ComfyUI官方使用 OpenAI 的图像生成 API 从图像输入和文本提示创建了一个重新设计的图像,然后将其传递给本地 ComfyUI Wan2.1 图像到视频或 Wan2.1 VACE 控制视频生成工作流程。
GPT Image 1 + Wan2.1 I2V 工作流
GPT Image 1 + Wan2.1 VACE Control 工作流
Token 成本和质量选项
-
输入:每 100 万文本 token 5 美元,每 100 万图像 token 10 美元。 -
输出:每 100 万图像 token 40 美元,与 OpenAI 的定价相同。 - 价格:https://platform.openai.com/docs/pricing
按分辨率和质量划分的 Token 成本:
分辨率 | 质量 | 估计输出 Token | 估计成本 |
---|---|---|---|
1024x1024 | 低 | ~11,000 | ~$0.44 |
1024x1024 | 中 | ~35,000 | ~$1.40 |
1024x1024 | 高 | ~100,000 | ~$4.00 |
1024x1536/1536x1024 | 低 | ~16,500 | ~$0.66 |
1024x1536/1536x1024 | 中 | ~52,500 | ~$2.10 |
1024x1536/1536x1024 | 高 | ~150,000 | ~$6.00 |
更多模型即将推出
这仅仅是个开始。ComfyUI官方正在积极扩展对更广泛的外部模型的支持——敬请关注即将到来的集成,这将进一步释放 ComfyUI 作为通用生成式 AI 界面的潜力。