板块导航

+ 资源分享区

223934veietq2nggl5qlqq.webp

附件信息右侧广告

打开方式:
资料大小: 191.77 KB
下载次数: 0
上传会员: 嘟先生
上传时间: 2025-10-29
本站网址: bbs.monster
查看附件所在的主题
下载附件

附件下载与主题内容间广告

炸了！三宫格写真开源方案：Qwen Image Edit+RH 工作流，不用手动调，传素材就生成｜新手友好:

三宫格写真有新方案！不用豆包即梦，用开源模型 Qwen Image Edit，RH 已搭好工作流，上传参考图 + 字幕文案 + 场景，自动生成，操作方便。

一、三宫格写真介绍
最近三宫格写真有点火，我看挺多人都发了教程，不过大部分人是直接用豆包即梦做的，今天我这里也分享一种方案，是直接用开源模型Qwen Image Edit来实现，我在RH上给大家搭建了工作流，只要上传参考图、字幕文案、场景，就可以自动生成三宫格写真图了，还是很方便的。
这种方案文字不会糊，还可以选字体，后期还可以批量自动化，妙啊。
来看几个我做的土味情话案例：
挺好玩的吧哈哈。
二、工作流思路拆解
先说下大体思路：
我这个流是使用qwen编辑模型来实现，结合之前介绍的next-scene场景一致性模型，生成三张场景图后，再拼接在一起，最后再结合上中英文字幕，就实现了这个需求。
先来看入参，你只需上传图像、填写字幕文案（3句话最好），以及想要的场景。
剩下的就交给大模型，自动帮我们生成想要的场景。我是让大模型帮我生成json格式的，方便我后面提取内容。
{
"image1": "Next Scene: 酒吧外街景，中景镜头聚焦银发女子轻抚颈间项圈，眼神微挑望向镜头，黑色开衫半敞露出灰色紧身短上衣，背景是暖黄灯光下的店铺橱窗与模糊行人，光影延续参考图都市夜景调性，人物姿态慵懒带诱惑，暗示即将开启对话",
"chinese1": "你知道什么酒最厉害，让人醉吗?",
"english1": "Do you know the strongest liquor that makes people drunk?",
"image2": "Next Scene: 酒吧门口台阶，特写镜头捕捉女子微微歪头、唇角上扬的神情，右手轻抬指向身后霓虹招牌，发丝随风微扬，背景虚化为酒吧入口与闪烁彩灯，光影保持原图暖调对比，动作自然承接前帧，营造神秘邀约氛围",
"chinese2": "什么酒?",
"english2": "What kind of liquor?",
"image3": "Next Scene: 酒吧内吧台前，近景镜头展现女子倚靠吧台，左手持高脚杯轻晃红酒，眼波流转直视镜头，黑色皮裤与灰上衣细节清晰，背景是朦胧酒架与暖光吊灯，光影延续原图质感，表情温柔含笑，呼应‘天长地久’的浪漫承诺",
"chinese3": "和你天长地久!",
"english3": "The one with you, forever!"
}

下面是提取json里面的每个字段，image系列的3个字段是我要提取的内容，然后通过拼接，最终合并成文案传入到采样中。
采样出图环节其实很简单，之前介绍过，利用Qwen Image Edit来实现，把上面提取的提示词传入到提示词行节点，这样就可以批量出图了。
出了图之后，就需要拼接文案了，我们利用前面json串里面提取的中英文字幕，分别使用文本覆盖节点来实现文本的覆盖。
最终三张图拼接起来就实现了这个三宫格写真图了，一致性保持的不错，挺有意思。

更多案例

注意事项
这个流核心还是提示词的处理以及最终的拼图，其他的没啥，提示词这边处理我加密了，大家自行编写替换吧。
有需要的也可以私聊付费解密。
三、在线使用
云端镜像
大家如果没有本地 ComfyUI 环境，或者本地显卡配置低于 16G 的，可以使用嘟嘟部署的仙宫云镜像，可直接加载使用。后续分享的工作流都会更像到镜像中，一周更新一次，方便大学学习。
目前整合了2个镜像，一个是Flux绘图用的，另外一个是针对视频模型的，之所以分开是一些模型兼容问题，分开比较好处理。
镜像名称：嘟嘟AI绘画趣味学
云平台镜像地址：
https://www.xiangongyun.com/image/detail/d961a7dc-ade3-4bd5-a7c6-92ac49ff5e4b?r=37BCLY
https://www.xiangongyun.com/image/detail/81716d29-4461-4b0b-ba4b-7b9b7dd569d3?r=37BCLY
新用户通过邀请码注册，总共可获得 8 元奖励，体验 4 个小时的 4090 作图时长。

同一主题附件字上面广告

同一主题附件:

板块导航

热门下载

223934veietq2nggl5qlqq.webp