Ostris重磅发布Flex.2-preview：全能扩散模型ComfyUI的图像生成神器

Flex.2-preview 是什么

Flex.2-preview 是Ostris团队推出的开源文本到图像扩散模型，其80亿参数架构专为多控制输入场景优化。不同于传统模型仅依赖文本提示，它创新性地整合了线条引导、姿态控制等多维度信号，形成更精准的生成逻辑。
该模型采用16通道潜在空间设计，可同时处理噪声输入、修复掩码等复杂数据流。目前支持通过ComfyUI或Diffusers库快速部署，特别适合需要精确控制生成结果的专业创作场景。

Flex.2-preview 的主要功能：

长文本图像生成：支持512token超长描述输入，准确还原复杂场景中的细节元素
智能图像修复：通过掩码标记修改区域，实现局部重绘而不影响整体构图
多类型控制引导：兼容线条图、深度图、姿态图等多种控制信号输入
轻量级微调适配：基于LoRA技术快速适配特定画风，微调成本降低70%

Ostris重磅发布Flex.2-preview：全能扩散模型ComfyUI的图像生成神器

模型特点

Flex.2-preview是Flex系列模型中的最新版本，其成长路线是这样的：

Flux.1 Schnell → OpenFlux.1 → Flex.1-alpha → Flex.2-preview

可以说，每一次迭代都让模型更灵活（flexible）、更可控、更实用，而这次的Flex.2，堪称是目前“最灵活”的文本转图像模型之一。

🔧 主要特性一览：

80亿参数：Flex.2 模型拥有 80 亿个参数，使其能够生成高质量的图像。
内置修图功能：Flex.2 内置了修图（inpainting）支持，可以直接在生成的图像中进行局部修改。
通用控制输入：模型支持通用的控制输入，包括姿态（pose）、线条（line）和深度（depth），使用户能够对生成的图像进行更精细的控制。
细调能力：Flex.2 设计为可细调的模型，用户可以通过训练低秩适应（LoRA）来微调模型以满足特定需求。
开源许可证：Flex.2 使用 Apache 2.0 许可证，确保模型的开放性和可访问性。
长文本输入：模型支持 512 个标记长度的文本输入，提供了更大的创作空间。
16 通道潜在空间：Flex.2 使用 16 通道的潜在空间，增强了模型的表达能力。

这不是“一个模型能干多事”，而是“一个模型集成了你需要的全部功能”。

安装与使用

你只需要安装 ComfyUI-FlexTools 插件，拿到 Flex2 Conditioner Node，再加上 comfyui_controlnet_aux 来生成控制图（如姿态图和深度图），就能轻松上手这款模型。

快速安装指南（简略版）：

安装 ComfyUI-FlexTools 插件（内含 Conditioner 节点）
下载 Flex.2-preview.safetensors 到 ComfyUI/models/diffusion_models/
安装 comfyui_controlnet_aux 以生成控制图
重启 ComfyUI，即可开始创作

插件：ComfyUI-FlexTools
插件地址：https://github.com/ostris/ComfyUI-FlexTools

模型下载：

模型下载：https://huggingface.co/ostris/Flex.2-preview/blob/main/Flex.2-preview.safetensors

模型直接下载即可。如下图框住的。下载后放置comfyUI/models/unets下