作者:@AIwood爱屋研究室
Boogu 0.1实测:ComfyUI秒支持、图像编辑与中文文字表现
一句话导读:这期围绕突然出现的神秘图片模型 Boogu 0.1 展开,作者实测了 ComfyUI 支持、Turbo/Base/Edit 几个版本的出图与编辑能力,并把它和 ZMH Turbo 做了直观对比。
核心内容:
1. 作者先说明 Boogu 0.1 是一个来源暂不明确的早期版本图片模型,官方已经给出 ComfyUI 支持,Kijai 也提交了 ComfyUI 适配 PR;如果急着尝鲜,可以切到相关分支或等待 ComfyUI 主分支合并。
2. 模型侧包含 Base、Edit、Turbo 等版本,量化格式里提到 BF16、FP8 和 NVFP4;文本编码器一类的配套模型与既有图像模型生态有一定共用关系,Turbo 版本还配有加速 LoRA。
3. 生图 Turbo 对比里,Boogu 在部分自然风光和人物场景会有过拟合或过锐的质感,NVFP4 相对好一些,BF16 有时更明显;但在藏族女性、时尚摄影等案例里,它比 ZMH Turbo 更偏写实,人物皮肤和画面质感更结实。
4. 中文文字能力是作者重点肯定的部分。早餐摊、公告栏、手写文字等测试中,Boogu 的文字准确率普遍比 ZMH Turbo 更好,尤其一些中文招牌和大段文字不容易糊弄过去;但手写体质感还不够自然,个别 BF16 抽卡也会出现文字跳层。
5. 二次元和国风场景中,Boogu 的光影、细节和饱和度更强,画面不像 ZMH Turbo 那么清淡;但 Turbo 版本也更容易显得浓烈或脏,需要根据题材取舍。
6. Base 模型没有 Turbo 那么浓烈,更接近 ZMH Turbo 的清淡画面,人物美化程度也低一些;代价是速度明显变慢,同样 10 组 1024x1536 测试里,Turbo/NVFP4 级别是几十秒,Base 大约跑到 400 多秒。
7. Edit 模型目前更适合单图编辑。双角色参考、换帽子等多图参考场景不太稳定,加速 LoRA 放进编辑模型后会出现格子和边缘异常;作者建议按 CFG 3.5、约 25 步来跑,不要强行给 Edit 加 Turbo LoRA。
8. 图像编辑的主要问题是偏移较大,背景文字也可能被改掉。作者给出的解决办法是先把原图缩放到 Flux Kontext 支持的尺寸节点,再接入编辑流程,偏移问题会明显改善。
9. 总体判断是 Boogu 0.1 还很早期,编辑能力暂时不够理想,但小体量图像编辑模型在社区里仍然稀缺;如果后续版本跟进,值得继续关注。当前更适合想测试写实质感、中文文字和 ComfyUI 新模型工作流的用户尝鲜。
适合人群:关注 Boogu Image、ComfyUI 新模型适配、Z image EDIT 替代方案、ZMH Turbo 对比、中文文字生成、写实人像与单图编辑工作流的用户。
相关夸克网盘链接:
【模型+工作流网盘地址:https://pan.quark.cn/s/e070e53dd9ce】
补充说明:本文根据授权视频音频转写整理;夸克链接来自视频简介,首屏评论和 UP 置顶评论未发现新的夸克链接。视频简介还提供 Boogu 模型 HuggingFace 地址和 Kijai 提交的 ComfyUI 支持 PR,建议结合原视频查看具体分支、节点和参数设置。 |