22

主题

0

回帖

153

贡献

高级合伙人

积分
1708
嘟先生 2025-9-24 01:13:02 | 显示全部楼层 | 阅读模式

大家好,我是嘟嘟,深耕ComfyUI赛道的程序员。

今天推出一个我制作很久的多人数字人对话付费解决方案!15 个全流程工作流(出图 / 克隆 / 生成),解决同框说话难点,普通用户易上手,RunningHub 领 1000 积分降成本。


一、数字人方案介绍

大家好,最近围绕多人数字人对话场景开发了一整套的开源解决方案,从图像素材(出图改图)、声音克隆、数字人生成一整套的工作流都包含进来了。可以帮助大家快速制作多人场景的对话。

给大家看几个案例,都是用这套工作流制作的:

这几个有的是视频转数字人(对口型配音),有的是图转数字人。 核心难点是多人同框的时候精准控制谁说话谁不说话。

二、整套方案介绍

本套方案是付费的,原价499,前100名99,卖完了就阶梯涨价

自助购买地址:https://buy.52aibot.com/

011148xvmd80w787w75a5l.webp

工作流全景如下: 011148f16yy63oxognxlgy.webp 目录大纲模块: 011148wewkwwq7bmbbiphr.webp 配套的使用手册:

011149ndj0mddros0tvtw0.webp

整体就是上面说的这样,工作流是放在RunningHub平台上的,大家拍了后会收到使用地址,打开后里面简介区有使用手册的说明,手册里面很详细了介绍了每个模块如何使用,以及给出了配套的一些案例素材。

里面除了调用香蕉模型和豆包模型只能线上使用外,其他工作流本地都有配套的插件的,所以本地玩家也可以拍了去学习,当然我这里不提供配套的模型,Wan系列的去找我以前发过的模型里面找。

这个页面里面的15个工作流,其中除了数字人那边个别工作流是没公开分享过的,其他的基本我都有免费分享过,这次主要是做了一次整合,把涉及到数字人这块可能用得上的工作流都放到一起了。 适合新人直接使用。

下面对整体的工作流做一个简要功能说明

本套工作流是直接在Runninghub平台上使用,用我上面的邀请链接注册,新人可以有1000积分的奖励,跑工作流是按生成时间消耗对应的积分的,1000积分可以跑挺久。

然后打开后里面一共包含15个工作流,顶部标题左侧有个开关,一次只选中其中一个工作流,这样就可以只跑这个工作流了。

011149vwgskr357r5i6043.webp 选中后,点击右上角的运行,即可开始执行对应的任务,非会员一次只能并发执行一个任务。 011149h2l1alps58i3cs35.webp

2.1 出图改图
011149g2ioziyemoyohoe2.webp

这个模块是用了Qwen的模型,搭建了3个工作流使用,包含批量出图,单次出图,以及API调用出图,解决大家出素材图的问题。

2.2 声音克隆
011149rndgudupkrueu0br.webp

声音克隆方案也是做数字人很重要的一个环节,我们要声音一致性,就需要参考指定的人的声音,这里我整理了目前最好用的2个声音开源模型MegaTTS3IndexTTS2,支持单人声音克隆、多人声音克隆,特备是后者,目前是支持带情绪的。

这2个克隆方案基本可以解决了目前声音素材的需求。

2.3 分镜制作
011149trvfl60zmlt8t1vv.webp

这个模块提供了2个工作流,分别调用了目前国内外最强的2个图像编辑模型,谷歌家的香蕉和字节家的豆包。

这2个模型可以用来快速改图,单图多图都可以,一致性效果超好。如下图这样,左边是原图,右边是出的图,一致性超高的改图模型。

011150cl395nidi3duzd5i.webp

这些模型调用都是需要收费的,香蕉模型在Runninghub上使用,头5次免费,超过5次了就每次调用5分钱(官方原价是3毛一次调用,RH这边便宜好几倍)。豆包模型我是调用的火山方舟的,配置好API后,头200次免费,超过的每次2毛,需要去火山方舟那边开通模型权限,手册里面有很详细的配置说明。

2.4 数字人

这里是我们整个流的核心,我一共提供了4个工作流给到大家,分别是:

  • 单人数字人生成-图生视频
  • 单人数字人生成-视频生视频
  • 双人数字人生成-图生视频
  • 双人数字人生成-视频生视频
011150p8yxmkylakf00aoo.webp

这4个流基本可以包含了所使用的场景了,要用哪一个具体看大家需求,只要记住,画面只有单个人物的就使用单人的2种流,有多个人的就要切到多人的流使用。

最难的是多人同框的场景,需要对声音素材做特殊的处理,一共两种处理方案,手册里面会说明,这样就可以精准的控制哪个人说话和闭嘴。

给你们看一些失败案例,注意看两个人的嘴巴,他们都开口说话了,这种就不符合要求。

然后你再看看我开头发的那些,对比下就知道我们开源的这套流有多好了。

2.5 视频自动提取分镜
011150lm07417ha1rwzhqv.webp

这个流之前分享过,核心是用来提取视频素材的关键帧分镜首图,还可以指定提取对应的分镜视频,是一个很好用的工具。

2.6 视频、图片反推脚本
011150xogvkm1ccvh1mjzj.webp

这2个一起说,也都是辅助类工具,可以帮助我们快速的反推视频或者图像成提示词,底层都是调用了大模型的能力,效果非常好。

使用场景也是很多的,比如你想参考一个广告视频,就可以用这个视频反推工具,让系统给你反推出来这个视频的每个分镜的描述词,然后你在用来自己创作。

图像也类似,反推出来这个图像的提示词,你在拿去出图,这个提示词反推的插件是目前我用过最强的,以前介绍洗图工作流的时候推荐过。

2.7 视频放大
011151n1x1rywmqh0kgkw2.webp

最后一个流是视频高清放大工作流,大家出图后如果想提高视频质量,就可以用这个流再做进一步的放大,也是一个不错的辅助工具。

更多案例展示

这套开源数字人的技术算是目前我体验下来最好的,可以制作单人对话,唱歌,对人对话等诸多场景,而且解决了时长的限制,可以制作多人对话场景。

三、总结

以上就是这套数字人工作流的整体概览说明,更多参数细节可以去看手册说明, 如果对外定制,这套工作流总价值至少2000+,不过面向C端的话,我卖个20份也算回本,所以初始价格定的极低,只要99。

有需要铁粉可以自行前往购买:https://buy.52aibot.com/

最后感谢大家支持,后面会陆续推出更多面向C端的商用低价工作流。

推荐阅读
阿里王炸开源!Wan2.2-Animate 碾压同类:98.7% 角色一致性 + 720P 高清,角色替换 / 动作模仿一键搞定妙啊!Qwen Image Edit 偏移问题方案升级,LoRA + 节点同步控,成功率暴涨|附工作流设计师狂喜!豆包 4 本地调用插件:火山方舟 API+200 张免费,电商图 / 创意图 2 毛 / 次速出创作者狂喜!Wan2.2 多图首尾帧串联:3 图 5 分钟出连贯长视频,剧情 / 产品视频无缝接|附工作流挖到宝!找了 N 久的 ComfyUI 分镜插件:comfyui_extractstoryboards 自动提帧 + 索引 640?wx_fmt.gif

更多AI绘画相关信息,可关注我的免费知识星球

011151vasnhgxi80z9ohdh.webp

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则