一、MiniMax-Remover介绍
今天介绍一个视频消除的新模型,MiniMax-Remover,我用它来搭建了个视频水印消除工作流,特别好用,今天分享给大家,以后就不要到处找付费工具了,快谢谢我~
MiniMax-Remover 是新型的视频目标移除方法,解决现有技术中常见的幻觉物体、视觉伪影以及推理速度缓慢等问题。
采用两阶段方法:
- 第一阶段:基于简化版的 DiT 架构,通过移除文本输入和交叉注意力层,得到更轻量级和高效的模型;
- 第二阶段:通过最小最大优化策略对模型进行蒸馏,识别对抗性输入噪声并训练模型在这些条件下生成高质量结果。
仅需 6 步采样且不依赖分类器自由引导(CFG),能实现先进的视频目标移除效果,显著提高了推理效率。
官方给的案例效果,看上去很强,一会我们来试试看。
二、安装介绍
插件还是用用kijai大佬的 ComfyUI-WanVideoWrapper,大家更新下即可。探索 Wan 2.1 结合 MiniMax-Remover 和 NAG(归一化注意力引导)的强大功能,实现高级视频对象移除!了解这款 AI 工具如何利用扩散变换器模型,在保持自然效果的同时,修剪视频中不需要的物体、阴影和噪点。探索实用的工作流程、测试洞察以及使用 ComfyUI、ControlNet 和 Fusion X 进行改进,以获得更高质量的输出。
MiniMaxRemover 模型: https://huggingface.co/Kijai/WanVideo_comfy/blob/main
- Wan2_1-MiniMaxRemover_1_3B_fp16.safetensors模型路径:
comfyUI/models/diffusion_models/
- Wan14B_RealismBoost.safetensors:
模型放在此处comfyUI/models/loras/
三、测评体验
- 最新视频去水印(三种方案任意切换):
这次一口气给大家弄了三种消除方案,针对可灵即梦那种水印视频,非常有效果,不输市面上一些付费的去水印工具。
先来介绍下工作流程,一共分为如下几块。
- 入参区域
- 模型加载
- 图像预处理
- 遮罩提取
- 采样生成
遮罩提取方案一共三种,我们最后说
入参区域
参数这边,一共三样,首先是要处理的视频加载,然后是最长边限制,最后是三种遮罩方案的选择,单选,默认选中第一个,根据实际情况调整即可。
模型加载
这里用的是 Wan生态的模型,只要把模型这里改成我们这次的 MiniMaxRemover即可,这是一个1.3B的模型,所以显存占用很低。
...
五、总结
以上这个视频消除新模型的使用说明了,很不错,大家可以用起来,以后视频去水印就不要去找付费软件了,直接在RH平台上一键使用,白嫖他不香吗。
技术的迭代是飞快的,要关注最新的消息才不会掉队。