多人数字人对话付费解决方案！15 个全流程工作流（出图 / 克隆 / 生成），解决同框说话难点，普通用户易上手

嘟先生 · 2025-9-24 01:13:02

大家好，我是嘟嘟，深耕ComfyUI赛道的程序员。

今天推出一个我制作很久的多人数字人对话付费解决方案！15 个全流程工作流（出图 / 克隆 / 生成），解决同框说话难点，普通用户易上手，RunningHub 领 1000 积分降成本。

一、数字人方案介绍
大家好，最近围绕多人数字人对话场景开发了一整套的开源解决方案，从图像素材（出图改图）、声音克隆、数字人生成一整套的工作流都包含进来了。可以帮助大家快速制作多人场景的对话。
给大家看几个案例，都是用这套工作流制作的：
这几个有的是视频转数字人（对口型配音），有的是图转数字人。核心难点是多人同框的时候精准控制谁说话谁不说话。
二、整套方案介绍
本套方案是付费的，原价499，前100名99，卖完了就阶梯涨价。
自助购买地址：https://buy.52aibot.com/

工作流全景如下：目录大纲模块：配套的使用手册：

整体就是上面说的这样，工作流是放在RunningHub平台上的，大家拍了后会收到使用地址，打开后里面简介区有使用手册的说明，手册里面很详细了介绍了每个模块如何使用，以及给出了配套的一些案例素材。
里面除了调用香蕉模型和豆包模型只能线上使用外，其他工作流本地都有配套的插件的，所以本地玩家也可以拍了去学习，当然我这里不提供配套的模型，Wan系列的去找我以前发过的模型里面找。
这个页面里面的15个工作流，其中除了数字人那边个别工作流是没公开分享过的，其他的基本我都有免费分享过，这次主要是做了一次整合，把涉及到数字人这块可能用得上的工作流都放到一起了。适合新人直接使用。
下面对整体的工作流做一个简要功能说明
本套工作流是直接在Runninghub平台上使用，用我上面的邀请链接注册，新人可以有1000积分的奖励，跑工作流是按生成时间消耗对应的积分的，1000积分可以跑挺久。
然后打开后里面一共包含15个工作流，顶部标题左侧有个开关，一次只选中其中一个工作流，这样就可以只跑这个工作流了。
选中后，点击右上角的运行，即可开始执行对应的任务，非会员一次只能并发执行一个任务。

2.1 出图改图

这个模块是用了Qwen的模型，搭建了3个工作流使用，包含批量出图，单次出图，以及API调用出图，解决大家出素材图的问题。

2.2 声音克隆

声音克隆方案也是做数字人很重要的一个环节，我们要声音一致性，就需要参考指定的人的声音，这里我整理了目前最好用的2个声音开源模型MegaTTS3和IndexTTS2，支持单人声音克隆、多人声音克隆，特备是后者，目前是支持带情绪的。
这2个克隆方案基本可以解决了目前声音素材的需求。

2.3 分镜制作

这个模块提供了2个工作流，分别调用了目前国内外最强的2个图像编辑模型，谷歌家的香蕉和字节家的豆包。
这2个模型可以用来快速改图，单图多图都可以，一致性效果超好。如下图这样，左边是原图，右边是出的图，一致性超高的改图模型。

这些模型调用都是需要收费的，香蕉模型在Runninghub上使用，头5次免费，超过5次了就每次调用5分钱（官方原价是3毛一次调用，RH这边便宜好几倍）。豆包模型我是调用的火山方舟的，配置好API后，头200次免费，超过的每次2毛，需要去火山方舟那边开通模型权限，手册里面有很详细的配置说明。

2.4 数字人
这里是我们整个流的核心，我一共提供了4个工作流给到大家，分别是：
单人数字人生成-图生视频
单人数字人生成-视频生视频
双人数字人生成-图生视频
双人数字人生成-视频生视频

这4个流基本可以包含了所使用的场景了，要用哪一个具体看大家需求，只要记住，画面只有单个人物的就使用单人的2种流，有多个人的就要切到多人的流使用。
最难的是多人同框的场景，需要对声音素材做特殊的处理，一共两种处理方案，手册里面会说明，这样就可以精准的控制哪个人说话和闭嘴。
给你们看一些失败案例，注意看两个人的嘴巴，他们都开口说话了，这种就不符合要求。
然后你再看看我开头发的那些，对比下就知道我们开源的这套流有多好了。

2.5 视频自动提取分镜

这个流之前分享过，核心是用来提取视频素材的关键帧分镜首图，还可以指定提取对应的分镜视频，是一个很好用的工具。

2.6 视频、图片反推脚本

这2个一起说，也都是辅助类工具，可以帮助我们快速的反推视频或者图像成提示词，底层都是调用了大模型的能力，效果非常好。
使用场景也是很多的，比如你想参考一个广告视频，就可以用这个视频反推工具，让系统给你反推出来这个视频的每个分镜的描述词，然后你在用来自己创作。
图像也类似，反推出来这个图像的提示词，你在拿去出图，这个提示词反推的插件是目前我用过最强的，以前介绍洗图工作流的时候推荐过。

2.7 视频放大

最后一个流是视频高清放大工作流，大家出图后如果想提高视频质量，就可以用这个流再做进一步的放大，也是一个不错的辅助工具。

更多案例展示
这套开源数字人的技术算是目前我体验下来最好的，可以制作单人对话，唱歌，对人对话等诸多场景，而且解决了时长的限制，可以制作多人对话场景。
三、总结
以上就是这套数字人工作流的整体概览说明，更多参数细节可以去看手册说明，如果对外定制，这套工作流总价值至少2000+，不过面向C端的话，我卖个20份也算回本，所以初始价格定的极低，只要99。
有需要铁粉可以自行前往购买：https://buy.52aibot.com/
最后感谢大家支持，后面会陆续推出更多面向C端的商用低价工作流。
推荐阅读
阿里王炸开源！Wan2.2-Animate 碾压同类：98.7% 角色一致性 + 720P 高清，角色替换 / 动作模仿一键搞定妙啊！Qwen Image Edit 偏移问题方案升级，LoRA + 节点同步控，成功率暴涨｜附工作流设计师狂喜！豆包 4 本地调用插件：火山方舟 API+200 张免费，电商图 / 创意图 2 毛 / 次速出创作者狂喜！Wan2.2 多图首尾帧串联：3 图 5 分钟出连贯长视频，剧情 / 产品视频无缝接｜附工作流挖到宝！找了 N 久的 ComfyUI 分镜插件：comfyui_extractstoryboards 自动提帧 + 索引 640?wx_fmt.gif

更多AI绘画相关信息，可关注我的免费知识星球

多人数字人对话付费解决方案！15 个全流程工作流（出图 / 克隆 / 生成），解决同框说话难点，普通用户易上手

浏览过的版块