DC-VideoGen 是一个用于加速视频扩散模型的新后训练框架。主要特性: - 🎬 支持在单个 H100 GPU 上生成高达 2160×3840 分辨率的视频
- ⚡ 相比基础模型,推理速度提升14.8倍
- 💰 相比从头开始训练,训练成本降低 230 倍(Wan-2.1-14B 仅需 10 个 H100 GPU 天)
DC-VideoGen 基于两项核心创新: - 深度压缩视频自动编码器(DC-AE-V):一种针对视频数据的新系列深度压缩自动编码器,提供 32×/64×空间压缩和 4×时间压缩。
- <强烈推荐>AE-Adapt-V:一种强大的适应策略,它使预训练的视频扩散模型能够快速且稳定地迁移到 DC-AE-V。
https://github.com/dc-ai-projects/DC-VideoGen
|