一、Wan FusionX介绍
Wan FusionX是一款基于Wan2.1(14B)多模型融合架构的视频生成模型,史诗级电影镜头,堪比专业模型,完全开源免费且高质量。该模型在镜头流畅度、画面一致性和细节还原度方面表现惊艳,可轻松实现电影级史诗场景。我们先来观看效果演示。它融合了Wan生态下的很多模型,直接拉高了Wan模型的一个层次,速度快,效果好。对于低显存用户,推荐使用量化过的GGUF模型。
这个FusionX模型里面有什么,我们来看看:
- CausVid – 因果运动建模,实现更好的场景流和戏剧性的速度启动
- ️ AccVideo – 提高时间对齐和真实感以及快速启动
- MoviiGen1.1 – 带来电影般的流畅度和照明
- MPS Reward LoRA – 针对运动动态和细节进行调优
- ✨ Custom LoRAs (by me) – 专注于纹理、清晰度和精细细节。(这两者都被设置为非常低的强度,影响非常小)
所以,它的画质会比普通的Wan模型好很多,,还有之前说的 VACE、Phantom 模型都支持了,基本Wan生态的模型它都有一个全套的适配,所以前面一大推的模型删了吧,以后就用FusionX这个系列就行,你们说算不算王炸。
二、插件安装(文末有网盘)
在comfyui中调用万相2.1模型需要用到WanVideoWrapper插件
插件地址:https://github.com/kijai/ComfyUI-WanVideoWrapper
进入comfyui的节点文件夹“custom_nodes”,在地址栏输入"cmd",然后敲回车,调出命令行
在命令行内输入指令: git clone https://github.com/kijai/ComfyUI-WanVideoWrapper.git
模型地址:
https://huggingface.co/vrgamedevgirl84/Wan14BT2VFusioniX/tree/main
他也有GGUF变体版本:
https://huggingface.co/QuantStack/Wan2.1_I2V_14B_FusionX-GGUF/tree/main
VACE:
https://huggingface.co/QuantStack/Wan2.1_T2V_14B_FusionX_VACE/tree/main
同时也有VACE GGUF 版本:
https://huggingface.co/QuantStack/Wan2.1_T2V_14B_FusionX_VACE-GGUF/tree/main
模型放置在comfyui/models/diffusion-models
文件夹内,文末文盘会提供。
三、使用体验:
1、文本转视频参数设置
- CGF 必须设置为 1 (任何更高的值都不会提供可接受的结果。)
- Shift-结果可能因 Resolution(分辨率)而异。1024x576 应从1开始,如果使用 1080x720,则从2开始。注意:为了获得更真实的效果,您需要较低的 Shift 值。如果你正在寻找更风格化的外观,请测试介于 3-9之间的较高偏移值
- 调度:我的大多数示例都使用Uni_pc但使用其他示例可能会得到不同的结果。真的就是实验。我注意到,根据提示,flowmatchcausvid 也运行良好,有助于处理小细节,
2、图像到视频参数设置
- CGF 必须设置为 1-任何更高的值都不会提供可接受的结果,
- Shift-对于图像到视频,我发现2是最好的,但您可以尝试。
- 调度:我的大多数示例都使用 dmp++_sde/beta,似乎效果最好,但您可以尝试。测试后,要获得更多运动并减少慢动作外观,请将帧数设置为 121,将每秒帧数设置为 24,这可以提供高达50% 的运动速度提升。
其他重要细节:
- 视频生成只需 6个步骤,但 8-10 个步骤可产生最佳质量。较低的台阶非常适合快速的草稿,速度增益很大。
- 不要重新添加 CausVid、AccVideo 或 MPS LORA - 它们已经烘焙到模型中,可能会导致不需要的结果。
- 您可以使用其他 LORA 进行其他样式设置 - 请随意试验。
- 所有演示视频均以 1024x576、81 帧生成,仅使用此模型-没有放大、插值或额外的 LORA.
- 在 RTX 5090 上渲染 - 使用列出的设置,每个视频大约需要 138 秒
- 如果 VRAM 用完,请启用块交换 - 从 5 个块开始,然后根据需要进行调整。
- SageAttn 已启用,可提供高达 30% 的速度提升。(仅限包装器)。
- 不要使用 teacache 一由于步数少,因此没有必要。
- “增强视频“和“SLG”功能未经过测试-请自行探索。
- 测试了"增强视频”,打开它后您可以获得更生动的结果。设置在 2-4 之间。实验!SLG 没有经过太多测试。
四、总结
以上就是Wan最新的融合模型 FusionX的视频介绍了,这个真的是王炸,跟原版的相比较,不仅速度更快,对提示词的遵从能力也更好,所以可以大胆的替换掉以前的那些模型了。