一、nunchaku0.3.0.dev2介绍
之前分享过一篇介绍Flux加速插件-ComfyUI-nunchaku详细安装教程,当时就只介绍到 0.2版本,最近又更新了一波大的,到0.3.0 dev2了,不仅修复了之前的一些问题,还支持了CN2,以及puild这些功能。
Nunchaku 是由 MIT Han Lab 开发的 4位扩散模型高效推理引擎,专为优化生成式模型(如Stable Diffusion)的推理速度和显存占用设计。结合 SVDQuant量化技术,它在保持生成质量的同时显著提升性能。
技术优势
- 显存优化:相比传统BF16模型,显存占用减少 3.6倍(例如16GB显存设备可运行更大模型)。
- 速度提升:在16GB显存设备上,推理速度比16位模型快 8.7倍,比传统4位量化(NF4 W4A16)快 3倍。
- 无损生成:通过低秩分解和核融合技术,4位量化模型生成质量与原始模型几乎无差异(参考官方对比图)。
- 兼容性:支持Flux模型生态、Redux、Lora、ControlNet及多显卡架构(NVIDIA Ampere/Ada/A100)。
二、手动安装
要更新到最新的 nunchaku0.3.0.dev2,需要做2个步骤
2.1 插件更新
插件地址:https://github.com/mit-han-lab/ComfyUI-nunchaku
目前只有dev版本才支持最新的功能,所以这里安装了插件后,要手动切换到dev版本。
以前安装其他的一些插件也介绍过如何切换到dev版本。
进入这个插件的目录,打开cmd命令窗口
分别输入以下两个命令即可
git switch dev
git pull
第一个就是切换到dev版本,第二个就是拉取最新更新。
2.2 安装轮子
这是我找的一些轮子,目前是支持了 torch2.6和torch2.7对应的python不同版本。
https://modelscope.cn/models/Lmxyy1999/nunchaku/files
所以至少要torch 2.6以上,之前我安装的还是torch2.5呢,最近好像发布了torch2.7的,所以我自己是直接秋叶整合包那边一键升级的。
CUDA这个我还主动去安装了最新的版本,这样才支持cuda12.8 :https://developer.nvidia.com/cuda-toolkit-archive
先卸载掉旧的,再安装新的
python.exe -m pip uninstall nunchaku
python.exe -m pip install nunchaku-0.3.0.dev2+torch2.7-cp310-cp310-win_amd64.whl
安装上了就搞定了。
模型路径(找到自己本地ComfyUI的python路径。):
comfyui\python\Lib\site-packages\nunchaku\models\pulid\eva_clip\model_configs\
路径下即可.
三、nunchaku一键脚本V2.1:
下载一键安装脚本,打开nunchakuHelper_V2.1.exe。
支持以下环境:
- torch2.6+python3.12
- torch2.7+python(3.10、3.11、3.12)
如果文件没有放在comfyui根目录,需要手动拖动目录
全自动一键安装模型、节点、插件、轮子 (文末下载工具)