三宫格写真有新方案!不用豆包即梦,用开源模型 Qwen Image Edit,RH 已搭好工作流,上传参考图 + 字幕文案 + 场景,自动生成,操作方便。
一、三宫格写真介绍最近三宫格写真有点火,我看挺多人都发了教程,不过大部分人是直接用豆包即梦做的,今天我这里也分享一种方案,是直接用开源模型Qwen Image Edit来实现,我在RH上给大家搭建了工作流,只要上传参考图、字幕文案、场景,就可以自动生成三宫格写真图了,还是很方便的。
这种方案文字不会糊,还可以选字体,后期还可以批量自动化,妙啊。
来看几个我做的土味情话案例:



挺好玩的吧哈哈。
二、工作流思路拆解
先说下大体思路:
我这个流是使用qwen编辑模型来实现,结合之前介绍的next-scene场景一致性模型,生成三张场景图后,再拼接在一起,最后再结合上中英文字幕,就实现了这个需求。
先来看入参,你只需上传图像、填写字幕文案(3句话最好),以及想要的场景。

剩下的就交给大模型,自动帮我们生成想要的场景。 我是让大模型帮我生成json格式的,方便我后面提取内容。
{下面是提取json里面的每个字段,image系列的3个字段是我要提取的内容,然后通过拼接,最终合并成文案传入到采样中。

采样出图环节其实很简单,之前介绍过,利用Qwen Image Edit来实现,把上面提取的提示词传入到提示词行节点,这样就可以批量出图了。
出了图之后,就需要拼接文案了,我们利用前面json串里面提取的中英文字幕,分别使用文本覆盖节点来实现文本的覆盖。

最终三张图拼接起来就实现了这个三宫格写真图了,一致性保持的不错,挺有意思。






这个流核心还是提示词的处理以及最终的拼图,其他的没啥,提示词这边处理我加密了,大家自行编写替换吧。
有需要的也可以私聊付费解密。
三、在线使用大家如果没有本地 ComfyUI 环境,或者本地显卡配置低于 16G 的,可以使用嘟嘟部署的仙宫云镜像,可直接加载使用。后续分享的工作流都会更像到镜像中,一周更新一次,方便大学学习。
目前整合了2个镜像,一个是Flux绘图用的,另外一个是针对视频模型的,之所以分开是一些模型兼容问题,分开比较好处理。
镜像名称:嘟嘟AI绘画趣味学


云平台镜像地址:
https://www.xiangongyun.com/image/detail/d961a7dc-ade3-4bd5-a7c6-92ac49ff5e4b?r=37BCLY
https://www.xiangongyun.com/image/detail/81716d29-4461-4b0b-ba4b-7b9b7dd569d3?r=37BCLY
新用户通过邀请码注册,总共可获得 8 元奖励,体验 4 个小时的 4090 作图时长。