|
阿里Qwen团队重磅发布Qwen-Image-Layered!首创“原生分层生图”技术,自动生成背景、主体、前景独立的RGBA图层。告别复杂抠图与重绘,实现真正的AI图像可编辑,设计师的福音来了! 一、Qwen-Image-Layered图像分层技术介绍AI 绘画圈,大家都有一个共同的痛点: 图生成出来是很漂亮,但它是一张“死图”(Flat Image)。 - 想把人物往左挪一点?不行,背景会留个大坑。
- 想把前景的遮挡物拿掉?不行,要重绘半天。
- 想把素材抠出来做海报?还得去 PS 里钢笔抠图。
“只管生,不管改”,是目前所有主流模型(SD, Midjourney, Flux)的通病。 但今天,阿里 Qwen 团队联合香港科技大学,甩出了一篇重磅论文——Qwen-Image-Layered,它可能要彻底改变这个局面了! 简单来说:它生成的不是一张 JPG,而是一套自带图层的“PSD”! Qwen-Image-Layered 能够根据你的提示词,智能地将画面拆解为不同的图层: - 背景层:完整的环境描写。
- 主体层:清晰、带透明通道 (RGBA) 的人物或物体。
- 前景/装饰层:独立的点缀元素。
AI 绘图终于能分层了!Qwen 新模型自带“PSD属性”,设计师狂喜!
还挺有意思的,这个需求是个刚需,现在开源界终于有了,今天就带大家一起尝尝咸淡。 二、相关安装目前ComfyUI官方第一时间支持了该模型,想本地玩的话记得把本地更新到最新。 ComfyUI官方给出的模型:https://huggingface.co/Comfy-Org ... d_ComfyUI/tree/main 包含: - qwen_image_layered_bf16.safetensors
- qwen_image_layered_vae.safetensors
目前bf16模型要40G,太大了,等社区版出来吧,VAE也是个新的,传统的VAE只能处理RGB图像,但是这里需要处理带透明度的RGBA图像,所以升级了下,变成四通道的VAE。 对了GGUF版本也给大家提供:https://huggingface.co/QuantStac ... ered-GGUF/tree/main
AI 绘图终于能分层了!Qwen 新模型自带“PSD属性”,设计师狂喜!
网盘给大家提供了Q6版本的GGUF,文末获取
AI 绘图终于能分层了!Qwen 新模型自带“PSD属性”,设计师狂喜!
三、测评体验超好玩,推荐给你!
AI 绘图终于能分层了!Qwen 新模型自带“PSD属性”,设计师狂喜!
目前这个支持文生图层和图像拆分两种,我工作流做了整合,根据需求自行选择要用哪种。 文生图层
这种是根据提示词直接生成,生成的时候就自动把图层分好了。 RH上体验,跑一张1024x1024的,需要5分钟。 首先是模型加载,我这里有用上一个4步加速,不然原模型跑太慢了要6-10分钟才出图,黄花菜都凉了,这个bf16近40G。大家带概率跑不起来的,后面改成用gguf模型会好一些。
AI 绘图终于能分层了!Qwen 新模型自带“PSD属性”,设计师狂喜!
入参的话,和正常文生图一样,填写提示词,设置宽高即可。
AI 绘图终于能分层了!Qwen 新模型自带“PSD属性”,设计师狂喜!
有个新的地方是这里,需要你设置帧数,涉及到最终分几层,默认设置13对应3层,想要跟多,就调整这个数量即可。
AI 绘图终于能分层了!Qwen 新模型自带“PSD属性”,设计师狂喜!
最后是采样,因为我用了加速,所以这里步数就8步,CFG 1或者2,这里根据大家实际跑的内容来调整,想要细节更多就设置2,想要速度快就设置1。
AI 绘图终于能分层了!Qwen 新模型自带“PSD属性”,设计师狂喜!
抽了挺多张卡的,我发现存在不稳定性,有时候效果好,有时候不行,所以就需要用加速模型来测试。 中国风插画大师杰作,国风线稿插画,抽象画风,倪传婧的风格,中国节日特色吉祥物:醒狮,身形图案完整,美轮美奂,线条柔美灵动,眼睛炯炯有神,威严的神态,优雅的姿势,奢华装饰艺术,中国传统纹饰,荧光金色线条,0.5mm极细金色金属质感勾边,中国红背景。中景正构图,国风奇幻流派,肌理线条繁复,纹饰细节精致,国风神秘氛围。高清渲染,高品质细节,超高清分辨率,最佳品质,8K壁纸。画面上方用轻透淡金艺术字书写 “2026 Chinese New Year 福星高照”
AI 绘图终于能分层了!Qwen 新模型自带“PSD属性”,设计师狂喜!
上面这图的效果我挺满意,这个是满配模型跑了40步,1024x1536出的图,跑了有10分钟。 一只萌态可掬胖嘟嘟的鲨鱼身着沙滩裤,旁边飞着一只穿沙滩裤的蜜蜂,沙滩场景,3D写实风格,特写,幽默搞笑,8K分辨率,强烈光影效果,真实摄影感
AI 绘图终于能分层了!Qwen 新模型自带“PSD属性”,设计师狂喜!
这张图我开始用4步加速lora,就跑了2分钟。 用了加速后质量是有点下降,但是速度快。 整体跑下来,用了加速后图像质量确实会降低,这个模型本身出图效果就好像没有Qwen的好,所有有时候跑的图很拉跨哈哈。 比如下面这种
AI 绘图终于能分层了!Qwen 新模型自带“PSD属性”,设计师狂喜!
图像分层
图像分层的话,大家把左侧开关开启就行,上传一张图,然后调整的分辨率系数,默认和原图保持一致。 提示词那边可以不写,留空即可。
AI 绘图终于能分层了!Qwen 新模型自带“PSD属性”,设计师狂喜!
这里我还是使用加速的版本来测试,你看到的都是我随机跑的图,让大家有个直观的感受。
AI 绘图终于能分层了!Qwen 新模型自带“PSD属性”,设计师狂喜!
AI 绘图终于能分层了!Qwen 新模型自带“PSD属性”,设计师狂喜!
下面这个失败
AI 绘图终于能分层了!Qwen 新模型自带“PSD属性”,设计师狂喜!
AI 绘图终于能分层了!Qwen 新模型自带“PSD属性”,设计师狂喜!
这个的话还行 测试下来存发现存在不可控性,有时候分层的不错可以用,有时候就不行,个别元素归并不合理,就没法用。 整体来说,算是初步实现了能力,在速度和质量上大家自己需要做出取舍,我推荐先在RH上体验吧。
|