17

主题

2

回帖

199

贡献

高级合伙人

积分
2822
colour 2025-10-4 20:25:11 | 显示全部楼层 | 阅读模式
DC-VideoGen:基于深度压缩视频自动编码器的高效视频生成(1)
                               
登录/注册后可看大图

DC-VideoGen 是一个用于加速视频扩散模型的新后训练框架。主要特性:
  • 🎬 支持在单个 H100 GPU 上生成高达 2160×3840 分辨率的视频
  • ⚡ 相比基础模型,推理速度提升14.8倍
  • 💰 相比从头开始训练,训练成本降低 230 倍(Wan-2.1-14B 仅需 10 个 H100 GPU 天)
DC-VideoGen 基于两项核心创新:
  • 深度压缩视频自动编码器(DC-AE-V):一种针对视频数据的新系列深度压缩自动编码器,提供 32×/64×空间压缩和 4×时间压缩。
  • <强烈推荐>AE-Adapt-V:一种强大的适应策略,它使预训练的视频扩散模型能够快速且稳定地迁移到 DC-AE-V。

https://github.com/dc-ai-projects/DC-VideoGen
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则