|
|
WAN animate的生成是有能力上限的,总帧数越多,误差积累就会越多,最后画面崩坏是难免。所以我们的第一目的是减少运算量。
不要直接1920*1080,温总的48g也容易爆显存,建议1280*720(这里的长宽必须是16的倍数,不然有时会报错),然后再接一个FlashVSR超分。
也不要直接上传60fps的视频,因为总帧数一多就会误差积累,然后劣化,建议上传24fps的视频,最后接一个补帧的节点。
fan fact:【1920*1080 60FPS 的运算量是 1280*720*24FPS的5倍以上】
上传的人像图片需要跟视频的前几帧图片构图和姿势尽量一致。因为图片参考对于最终视频生成效果也有很大的影响,如果图片中没有腿,不是正面,而参考视频是全身正面舞,最终视频就是脑补出两条腿和正面,而模型脑补出东西质量一般。这里可以使用qwen edit 去调整人像
关于人像的质量,白转和墨幽都是极佳的,原生感很强,lora可以用kook的千问写实,效果非常不错。
流的搭建方面:
不要用relight lora,可能导致奇怪的光影
官流的防劣化是做的比较好的。但是官流不能根据视频长度自适应最终视频的长度,建议加一个获取图像范围节点来删除多余帧。
图片中的音频有时会差几帧对不上,如果出现,把vhs的load video节点换成Comfy原生的load video节点,用get video components来获取音频,这样保证音频与画面完全同步。
手部依旧会崩,不知道当时训练的时候是用的哪个节点的骨骼图。我用的是controlnet aux的DW姿态预处理器,如果你有更好的解决手崩的方法,欢迎留言。
最后祝大家都能生成好看的美女(男)!
-
原视频截图
|
|