Load Checkpoint(加载模型)
【Load Checkpoint】节点用于选择大模型。点击【ckpt_name】可以显示可用的模型列表。
CLIP Text Encode(CLIP 文本编码)
节点用于输入正向提示词和负向提示词。该节点获取提示词并将输入到 CLIP 语言模型中。CLIP 是 OpenAI 的语言模型,将提示词中的每个单词转换为 embeddings
。
diffusion model 扩散模型
扩散模型是一种生成模型,通过逐渐添加噪声到数据中,然后训练模型以去除噪声,从而生成数据。它在生成图像和其他类型的数据中显示出很强的能力。扩散模型的训练过程包括一个前向过程(添加噪声)和一个反向过程(去除噪声)。
denoise 降噪
降噪是指从带有噪声的图像或数据中恢复出清晰的信息。在扩散模型中,降噪指的是模型通过逐步减少噪声来恢复数据的过程,使生成的图像尽可能接近真实图像。
Latent 潜像
潜像指的是在生成模型中,用于表示数据的隐含表示或特征。它是通过编码器将数据(例如图像)转换为一种低维的、抽象的表示,这种表示包含了数据的核心特征。
Latent space 潜空间
潜空间是一个高维空间,用于表示数据的潜在特征。在生成模型中,数据首先被映射到潜空间中,然后通过解码器从潜空间中生成新数据。潜空间的特性使得模型能够生成各种复杂的数据样本。
KSample(采样器)
【KSample】节点是 Stable Diffusion 中图像生成的核心。采样器将随机图像进行逐步降噪,来生成与提示词相匹配的图像。
【KSample】节点主要有以下参数:
- seed(随机种子):随机种子值控制清晰图像的初始噪声,从而控制最终图像的组成。
- control_after_generate(生成后操作):表示每次生成图片后,随机种子将如何变化。
- fixed(固定):保持种子不变;
- increment(增量):增加
1
; - decrement(减量):减少
1
; - randomize(随机):随机值。
- steps(采样步数):采样步骤数。
- cfg(提示词相关性):CFG(Classifier Free Guidance)表示为无分类器信息引导规模。CFG 是控制稳定扩散应遵循文本提示的紧密程度的设置,即提示词相关性。
- sampler_name(采样器名称):用于选择采样器。
- scheduler(调度程序):控制噪声水平在每个步骤中如何变化。
- denoise(降噪):降噪过程应消除多少百分比的初始噪声。
1
表示全部。
VAE
VAE(Variational Autoencoder)是一种生成模型,旨在通过编码器和解码器来学习数据的潜在表示。编码器将输入数据映射到潜空间,解码器则从潜空间中的潜像生成新的数据。VAE的目标是最大化数据的对数似然函数,同时最小化潜空间的分布与预设分布之间的差距。