OmniGen2:迈向统一多模态生成的未来引擎,通吃所有AIGC神操作

一、OmniGen2简介:

OmniGen2是一款强大且高效的统一多模态模型。与 OmniGen v1相比,OmniGen2为文本和图像模态分别设置了独立的解码路径,采用未共享参数和解耦的图像标记器。OmniGen2在具有以下四项主要核心优势:

  • 视觉理解:OmniGen2集成并集成了Qwen-VL-2.5视觉大基础模型解读和分析图像内容的强大能力。
  • 文生图生成:同时OmniGen2包含基本的文生图能力,能够根据文本提示创建高保真且美观的图像。
  • 指令引导图像编辑:以高精度执行基于指令的复杂图像修改,属于优秀的开源图像融合模型。
  • 上下文生成:能够处理并灵活组合包括人物、参考对象和场景在内的多种输入,生成新颖且连贯的视觉输出。

OmniGen2:迈向统一多模态生成的未来引擎,通吃所有AIGC神操作

二、插件及模型安装

OmniGen2插件地址:https://github.com/Yuan-ManX/ComfyUI-OmniGen2

将此仓库克隆到你的 ComfyUI 的 custom_nodes 目录中:

cd ComfyUI/custom_nodes
git clone https://github.com/Yuan-ManX/ComfyUI-OmniGen2.git

下载OmniGen模型

在/ComfyUI/models/Omnigen目录中,下载OmniGen模型。可以从Hugging Face的仓库中下载:

# 替换以下命令中的路径为您实际的OmniGen模型目录
cd /ComfyUI/models/Omnigen
git clone https://huggingface.co/Shitao/OmniGen-v1

OmniGen2:迈向统一多模态生成的未来引擎,通吃所有AIGC神操作

三、插件功能演示及工作流

OmniGen2:迈向统一多模态生成的未来引擎,通吃所有AIGC神操作OmniGen2:迈向统一多模态生成的未来引擎,通吃所有AIGC神操作

OmniGen2说明:

要在 OmniGen2 中取得最佳效果,你可以根据具体使用场景调整以下关键超参数。

  • text_guidance_scale:控制输出严格遵循文本提示的程度(无分类器引导)。
  • image_guidance_scale:此参数控制最终图像应与输入参考图像相似的程度。
    • 权衡 :较高的值使输出更忠实于参考图像的结构和风格,但可能会忽略部分文本提示。较低的值(~1.5)则赋予文本提示更多影响力。
    • 提示 :对于图像编辑任务,我们建议将其设置为 1.2 到 2.0 之间;对于上下文生成任务,较高的 image_guidance_scale 将保持输入图像中的更多细节,我们建议将其设置为 2.5 到 3.0 之间。
  • max_pixels: 当图像的总像素数(宽度 × 高度)超过此限制时,会自动调整图像大小,同时保持其宽高比。这有助于管理性能和内存使用。
    • 提示 : 默认值为 1024*1024。如果你遇到内存问题,可以降低此值。
  • max_input_image_side_length: 输入图像的最大边长。
  • negative_prompt: 告知模型在图像中不希望看到的内容。
    • 示例 : 模糊,低质量,文字,水印
    • 提示 : 为获得最佳效果,尝试使用不同的负面提示。如果不确定,只需使用默认的负面提示。
  • enable_model_cpu_offload可减少 VRAM 使用量近 50%,且对速度影响微乎其微 
    • 这是通过在模型权重不使用时将其卸载到 CPU 内存中实现的。
  • enable_sequential_cpu_offload:将 VRAM 使用量降至 3GB 以下,但性能会显著变慢。
    • 这种方式通过将模型卸载到子模块中,并按需将它们顺序加载到 GPU 上工作。

一些提高生成质量的建议:

  • 使用高分辨率和高质量的图像。图像太小或模糊也会导致输出质量低。我们建议尽可能确保输入图像大小大于512。
  • 提供详细说明。对于上下文生成任务,请指定模型应使用哪个图像中的哪些元素。
  • 尽可能多地使用英语,因为目前 OmniGen2 在英语方面的表现优于中文。

下载权限

查看
  • 免费下载
    评论并刷新后下载
    登录后下载
  • 免费下载
    免费下载:
    签到可领取积分

查看演示

  • {{attr.name}}:
您当前的等级为
登录后免费下载登录 小黑屋反思中,不准下载! 评论后刷新页面下载评论 支付免费指引:【签到得积分即可下载】 请先登录 您今天的下载次数(次)用完了,请明天再来 支付积分免费指引:【签到得积分即可下载】立即支付 支付免费指引:【签到得积分即可下载】立即支付 您当前的用户组不允许下载升级会员
您已获得下载权限 您可以每天下载资源次,今日剩余
温馨提示:本站提供的一切软件、教程和内容信息都来自网络收集整理,仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负,版权争议与本站无关。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给TA打赏
共{{data.count}}人
5人已打赏
主模型增强模型定制模型辅助模型进阶教程

黑森林实验室宣布已开源FLUX.1 Kontext-重磅开源旗舰图像模型:对标GPT-4o

2025-6-27 9:01:48

Flux插件人像摄影图形设计实用工具海报设计照片修复电商应用角色设计风格转换

flux完美出图:一键扩图工作流

2025-4-23 18:08:43

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索