作者:@AIwood爱屋研究室
Krea2本地生图实测:ComfyUI加载、ZImage对比与风格LoRA
一句话导读:这期视频实测 Krea2 在 ComfyUI 本地运行后的文生图表现,重点看它离开官方风格参考功能后,和 ZImage Turbo 在画面干净度、中式元素、中文文字、摄影理解与风格 LoRA 上的差异。
核心内容:
1. 作者先说明 ComfyUI 已经通过新分支支持 Krea2,本地运行需要把 ComfyUI 更新到支持 Krea2 的版本。官方模型包包含主模型、若干 LoRA、Text Encoder 和 VAE;转写中提到 Text Encoder 对应 Qwen3-VL 4B,VAE 使用 Qwen Image 的 VAE。
2. 工作流结构并不复杂,整体接近 ZImage 或标准图片生成工作流。关键是在 CLIP Loader 中选择 Krea2 类型,上方加载 Turbo FP8 主模型,下方加载 VAE,提示词接入后即可运行。Turbo 版本按 8 steps 跑,CFG 按常见 Turbo 模型用 1 左右。
3. 对比对象主要是 ZImage Turbo。作者跑了约十组常见场景,包括美式厚涂、二次元、中式京剧人物、未来城市、早点摊、日常人像、摄影慢门、汉服与芭蕾镜面动作等,用来观察风格、画质、构图和指令理解。
4. 在美式厚涂、未来城市和部分风格化图上,作者认为 Krea2 的画面更干净、更通透,色调和武器等细节更接近期望;ZImage Turbo 在这些场景里有时会显得更黄、更脏或更偏写实。
5. Krea2 对中国元素的理解好于很多海外开源模型。京剧服装、妆容、建筑、汉服意境、早点摊里的油条和小笼包等元素识别都比较到位;但中文和亚洲文字书写明显偏弱,只能偶尔蒙对几个字,早点摊招牌这类场景仍不如 ZImage Turbo。
6. 画质方面,作者多次提到 Krea2 有些“肉”,可能与使用的 Qwen Image VAE 有关。ZImage Turbo 的画面相对更结实,但皮肤和背景训练倾向不同:ZImage 更美化、更光滑,Krea2 会保留一些皮肤质感和斑点。
7. 摄影理解是 Krea2 的亮点之一。慢门光流、斜构图、高机位俯拍、焦外效果等提示,在视频展示的部分样例里更接近作者预期;ZImage Turbo 有时能响应但力度不足,尤其光流和倾斜构图不够准确。
8. 速度上,作者提到 Krea2 跑十组 1024x1536 图片约 87 秒,比 ZImage Turbo 慢一倍左右。它并不是单纯速度取胜,而更适合看重风格、构图和中式元素理解的文生图测试。
9. 官方还提供了多个风格 LoRA。视频里提到青蓝水彩插画风、单色水墨泼墨、低饱和简笔速写、微光/流光等风格,其中部分官方建议权重为 0.8 或 1.0。作者认为多数风格可以试,但微光 LoRA 有些过拟合,容易锁脸并出现大下巴脸。
10. 作者最看重的 Krea 风格参考/风格迁移功能,目前 ComfyUI 本地版本还没有开放,仍像此前一样依赖 API。也就是说,当前本地开源体验主要是文生图本身;如果想评估 Krea2 的完整吸引力,还要等风格参考和融合能力是否能落地。
适合人群:想在本地 ComfyUI 测试 Krea2、对比 ZImage Turbo 文生图效果,或关注海外开源图像模型中文/中式元素表现、摄影构图理解和风格 LoRA 可用性的用户。
相关夸克网盘链接:
【模型网盘地址:https://pan.quark.cn/s/b5c53d9b776f】
补充说明:本文根据授权视频音频转写整理;夸克链接来自视频简介,默认第一页评论和可见子回复未发现新的夸克网盘链接。 |