Flex.2-preview 是什么
Flex.2-preview 是Ostris团队推出的开源文本到图像扩散模型,其80亿参数架构专为多控制输入场景优化。不同于传统模型仅依赖文本提示,它创新性地整合了线条引导、姿态控制等多维度信号,形成更精准的生成逻辑。
该模型采用16通道潜在空间设计,可同时处理噪声输入、修复掩码等复杂数据流。目前支持通过ComfyUI或Diffusers库快速部署,特别适合需要精确控制生成结果的专业创作场景。
- 长文本图像生成:支持512token超长描述输入,准确还原复杂场景中的细节元素
- 智能图像修复:通过掩码标记修改区域,实现局部重绘而不影响整体构图
- 多类型控制引导:兼容线条图、深度图、姿态图等多种控制信号输入
- 轻量级微调适配:基于LoRA技术快速适配特定画风,微调成本降低70%
模型特点
Flex.2-preview是Flex系列模型中的最新版本,其成长路线是这样的:
Flux.1 Schnell → OpenFlux.1 → Flex.1-alpha → Flex.2-preview
可以说,每一次迭代都让模型更灵活(flexible)、更可控、更实用,而这次的Flex.2,堪称是目前“最灵活”的文本转图像模型之一。
🔧 主要特性一览:
- 80亿参数:Flex.2 模型拥有 80 亿个参数,使其能够生成高质量的图像。
- 内置修图功能:Flex.2 内置了修图(inpainting)支持,可以直接在生成的图像中进行局部修改。
- 通用控制输入:模型支持通用的控制输入,包括姿态(pose)、线条(line)和深度(depth),使用户能够对生成的图像进行更精细的控制。
- 细调能力:Flex.2 设计为可细调的模型,用户可以通过训练低秩适应(LoRA)来微调模型以满足特定需求。
- 开源许可证:Flex.2 使用 Apache 2.0 许可证,确保模型的开放性和可访问性。
- 长文本输入:模型支持 512 个标记长度的文本输入,提供了更大的创作空间。
- 16 通道潜在空间:Flex.2 使用 16 通道的潜在空间,增强了模型的表达能力。
这不是“一个模型能干多事”,而是“一个模型集成了你需要的全部功能”。
安装与使用
你只需要安装 ComfyUI-FlexTools 插件,拿到 Flex2 Conditioner Node,再加上 comfyui_controlnet_aux 来生成控制图(如姿态图和深度图),就能轻松上手这款模型。
快速安装指南(简略版):
安装 ComfyUI-FlexTools 插件(内含 Conditioner 节点)
下载 Flex.2-preview.safetensors 到ComfyUI/models/diffusion_models/
安装 comfyui_controlnet_aux 以生成控制图
重启 ComfyUI,即可开始创作
插件:ComfyUI-FlexTools
插件地址:https://github.com/ostris/ComfyUI-FlexTools
模型下载:
模型下载:https://huggingface.co/ostris/Flex.2-preview/blob/main/Flex.2-preview.safetensors
模型直接下载即可。如下图框住的。下载后放置comfyUI/models/unets
下
工作流示例:
从图像修补到深度控制,只需拖拽节点,复杂任务也能变得简单直观。
一句Prompt + 一个线稿/深度图/姿态图,就能让AI按照你的“剧本”走,不再靠“拼运气”。