37

主题

2

回帖

157

修为

绘灵

积分
328

图像质感提升双方案来袭!Qwen 负责构图,搭配腾讯 SRPO(Flux 美学微调,3 倍真实感)与经典 Wan2.2 模型,两者均主打写实风格,按需选择适配全场景创作。

一、构图+提升质感分享

之前分享过使用Wan2.2模型来提升图像的质感,今天再来分享一个方案,一起对比一下,就是使用SRPO来提升质感,构图的话用Qwen来出图。

SRPO是腾讯混元团队最新开源的Flux美学微调模型,核心是针对扩散模型(基于 FLUX.1.dev 模型)的人类偏好对齐技术优化,旨在提升生成内容的真实感美学质量,和Krea有点类似,这种这个的质感感觉更好一些。

SRPO 聚焦于解决现有扩散模型在人类偏好对齐中的两大关键问题:

  • 传统方法依赖多步去噪计算梯度来评分奖励,计算成本高,仅能优化少数扩散步骤;

  • 需持续离线调整奖励模型,才能实现照片真实感、精准光影等特定美学效果。 通过技术创新,SRPO 最终将 FLUX.1.dev 模型的人类评估真实感与美学质量提升了 3 倍以上,训练数据基于 HPD 数据集与 HPSv2 标准。

  • huggingface介绍https://huggingface.co/tencent/SRPO


二、工作流介绍

工作流已发Runninghub,前往体验or下载:

Qwen 构图 + SRPO/Wan2.2:腾讯混元开源 + 经典模型,写实质感双突破

Qwen 构图 + SRPO/Wan2.2:腾讯混元开源 + 经典模型,写实质感双突破

这套流的核心流程如下:

1:先用Qwen来实现初始的构图

2:然后分别采用SRPO和Wan2.2来实现洗图,提升质感

构图的话很简单,利用最基础的Qwen Image来出图,配合8步加速lora就行。 初始分辨率1024x1536,大家显存不够也可以替换成nunchaku,这一步核心还是用来做构图用,质感不需要关注。

Qwen默认模型出来的图本身质感也有所欠缺。

Qwen 构图 + SRPO/Wan2.2:腾讯混元开源 + 经典模型,写实质感双突破

Qwen 构图 + SRPO/Wan2.2:腾讯混元开源 + 经典模型,写实质感双突破

然后就是SPRO方案,这里利用放大模型,放大了1.6倍,然后传入采样器中,

Qwen 构图 + SRPO/Wan2.2:腾讯混元开源 + 经典模型,写实质感双突破

Qwen 构图 + SRPO/Wan2.2:腾讯混元开源 + 经典模型,写实质感双突破

最后是我们熟悉的Wan2.2洗图方案。利用T2V低噪模型,配合写实的lora来实现质感的提升。

Qwen 构图 + SRPO/Wan2.2:腾讯混元开源 + 经典模型,写实质感双突破

Qwen 构图 + SRPO/Wan2.2:腾讯混元开源 + 经典模型,写实质感双突破
案例展示

接下来,我们来跑一些图做对比,从左到右分别是Qwen、SRPO、Wan2.2出图对比。

细雨如丝的江南小巷,一位身着浅绿色 旗袍我江南女子,撑着一把油纸伞缓缓走来。上绣着淡雅的兰花,用淡蓝色丝线勾勒出花瓣的轮廓,裙摆上的雨渍晕染开来,仿佛一幅水墨画。佳人的秀发盘起,插着一支兰花形状的玉簪,眉眼间透着淡淡的忧愁。雨滴打在伞面上,溅起晶莹的水花,与她身上散发的幽兰气质相得益彰。

Qwen 构图 + SRPO/Wan2.2:腾讯混元开源 + 经典模型,写实质感双突破

Qwen 构图 + SRPO/Wan2.2:腾讯混元开源 + 经典模型,写实质感双突破

幻想风格,暗朦调,隐约的淡彩褪色,泛朦,对焦模糊,特写,一个渐变短发赛博朋克美女生模糊半身人像,凌乱美,高颜值,复古,迷离,低饱和,反射,质感,泛光模糊晕染,高噪点,胶片颗粒质感,极简风,灰度美学,写意,前卫视觉艺术美学,高级感,杰作,伦布朗光为基础,窥探视角,镜面反射,遮蔽构图,抽帧,近景,王家卫色调,全局朦胧模糊,隐隐约约的模糊人像,头发凌乱而突出,抽象,狂乱,失控,动态模糊,运动失焦,双重曝光

Qwen 构图 + SRPO/Wan2.2:腾讯混元开源 + 经典模型,写实质感双突破

Qwen 构图 + SRPO/Wan2.2:腾讯混元开源 + 经典模型,写实质感双突破

对焦模糊,强侧光(从酒肆灯笼暖光侧射),高饱和(酒肆木色与衣粉对比),高曝,过曝(灯笼光在酒碗泛亮),暗调,伦勃朗光(下颌亮部显柔和),强烈明暗对比,高反差,黄蓉,灵气鲜活(倚酒肆柜台递酒碗,唇角带笑),亮色搭配清新配色衣服(浅粉半臂+米白长裤,半臂绣酒坛纹),昂贵繁琐的发饰,武侠装扮(手中握酒壶,腰间挂钱袋),灵动美女,黄金比例的五官,具有辨识度的五官,侠气(洒脱中带江湖气),真实,质感(半臂纱质肌理通透,酒碗粗陶纹路),肌理质感,情感张力(狡黠藏豪爽),情绪氛围感拉满,奇特视角(从柜台下仰拍,酒碗朝镜头),胶片颗粒感,慢快门(捕捉酒液倒出轨迹),朦胧美学,层次感(酒肆木柜、人物、酒坛叠加),获奖作品,冷白皮。比例 9:16。 21岁高颜值大眼睛

Qwen 构图 + SRPO/Wan2.2:腾讯混元开源 + 经典模型,写实质感双突破

Qwen 构图 + SRPO/Wan2.2:腾讯混元开源 + 经典模型,写实质感双突破

极致超清,极致细节,真人建模,虚拟引擎背景透明,柔焦,华丽光影 淡粉色调,仙气飘飘,妖治女,,柔和灯光,超清画质,面容精致,细化五官轮廓,特写镜头,流体艺术,高细节,仙气,纱制衣服。朦胧破碎,忧伤

Qwen 构图 + SRPO/Wan2.2:腾讯混元开源 + 经典模型,写实质感双突破

Qwen 构图 + SRPO/Wan2.2:腾讯混元开源 + 经典模型,写实质感双突破

网红,超高颜值,在浴室用手机拍摄的网感自拍照,不看镜头,高冷风格,放荡不羁,自然而然,松弛感,每一个细节都体现出无比的真实,iphone手机拍摄特有的画质效果,22岁,长发,露肩,网图,图片来源于网络。究极细节,细节丰富的发丝。钓系拍照姿势,绿茶心机拍照风格,凸。真人照片,傲人身材

Qwen 构图 + SRPO/Wan2.2:腾讯混元开源 + 经典模型,写实质感双突破

Qwen 构图 + SRPO/Wan2.2:腾讯混元开源 + 经典模型,写实质感双突破

生成一张超高颜值网红,鞠婧祎长相,更幼态可爱。直发的网感美女,穿这件衣服在昏暗氛围感西餐厅吃饭的图。餐厅用图六的场景。人物在画面居中位置。不要占比太大,日常快照风格!一只手拿叉子正要吃桌上的甜点,头发和图一一样垂在衣服同样一侧,手和头发都不要挡住衣服上的钻石。 微微露出一侧肩膀,她仿佛不经意间看向镜头,以自然而然的松弛姿态,诠释着独特的钓系拍照风格,每一个细节都散发着绿茶心机拍照风格的魅力。 她的姿势看似随意,却又巧妙地凸显身材优势,每一处细微动作都透着精心设计后的自然感。在不经意间散发出别样的吸引力,让人感觉这就是一张在网络上广泛流传的极具网感的真人照片,无比真实且生动地展现出网红独特的魅力与气质。 要拍到整件上衣。

Qwen 构图 + SRPO/Wan2.2:腾讯混元开源 + 经典模型,写实质感双突破

Qwen 构图 + SRPO/Wan2.2:腾讯混元开源 + 经典模型,写实质感双突破

摄影照片,弯曲的枯松倒挂在悬崖绝壁上,残留的片片晚霞和孤零的野鸭在天上一齐飘飞。四周围是数不尽的青山,一望无际的碧水,西风箫箫,天地间一派浓浓的秋意。静静的夜里 皎洁的月影映照着高挂云帆的古代船儿,载着我行舟在湘江上,恍如置身在画图之中。

Qwen 构图 + SRPO/Wan2.2:腾讯混元开源 + 经典模型,写实质感双突破

Qwen 构图 + SRPO/Wan2.2:腾讯混元开源 + 经典模型,写实质感双突破

巨物出没,倏然化作一团烟雾,只闻一声惊天咆哮,雾气之中,窜出一头煞气冲霄的吊睛白虎,通体灿辉,宛如银铸,四爪玄灵之气缭绕,只一个纵跃,就往前扑来雄伟壮观的站在山下瀑布小溪上咆哮,尖爪突出,鞭长尾巴特写。。画面精细,细节精致丰富,完美融合神话传说,高清,电影灯光,真人摄影,神秘感,电影质感,大师杰作,高级感。大师作品,精致细节,超高清,巨物恐惧

Qwen 构图 + SRPO/Wan2.2:腾讯混元开源 + 经典模型,写实质感双突破

Qwen 构图 + SRPO/Wan2.2:腾讯混元开源 + 经典模型,写实质感双突破

注意事项

上面这些图对比可以看出来,SRPO和Wan2.2都有提升美学和图片质感的功能,不过SPRO的亚洲人像感觉没有Wan2.2来的好,个人是更喜欢Wan系列出的人像图的样子。

上面只是对Qwen的构图分别用这两种方案来提升质感,其实还有一种方案,就是Qwen构图+SRPO提升质感+人脸和手局部Wan2.2洗图。

只有就把他们各自的优点组合起来,大家可以自己试试看。

三、在线使用
云端镜像

大家如果没有本地 ComfyUI 环境,或者本地显卡配置低于 16G 的,可以使用嘟嘟部署的仙宫云镜像,可直接加载使用。后续分享的工作流都会更像到镜像中,一周更新一次,方便大学学习。

目前整合了2个镜像,一个是Flux绘图用的,另外一个是针对视频模型的,之所以分开是一些模型兼容问题,分开比较好处理。

镜像名称:嘟嘟AI绘画趣味学

Qwen 构图 + SRPO/Wan2.2:腾讯混元开源 + 经典模型,写实质感双突破

Qwen 构图 + SRPO/Wan2.2:腾讯混元开源 + 经典模型,写实质感双突破

Qwen 构图 + SRPO/Wan2.2:腾讯混元开源 + 经典模型,写实质感双突破

Qwen 构图 + SRPO/Wan2.2:腾讯混元开源 + 经典模型,写实质感双突破

云平台镜像地址:

https://www.xiangongyun.com/image/detail/d961a7dc-ade3-4bd5-a7c6-92ac49ff5e4b?r=37BCLY

https://www.xiangongyun.com/image/detail/81716d29-4461-4b0b-ba4b-7b9b7dd569d3?r=37BCLY

新用户通过邀请码注册,总共可获得 8 元奖励,体验 4 个小时的 4090 作图时长


主题回复
倒序浏览

225查看3回复

0

主题

17

回帖

23

修为

绘者

积分
24
liliyangyang 15 小时前 来自手机
这个厉害呀,大佬
举报 回复

0

主题

26

回帖

29

修为

绘者

积分
39
popkoktttkkk 7 小时前
感谢分享。
举报 回复

0

主题

9

回帖

26

修为

绘者

积分
44
zxz 2 小时前
这个厉害呀,大佬
举报 回复
发新帖
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

© 2001-2025 BBS.Monster