83

主题

2

回帖

169

修为

绘灵

积分
365

LTX 2.0太吃配置?社区大神出手优化!最低8G显存即可运行。本文详解三大优化绝招:ComfyUI专用插件+FP8量化模型+虚拟内存设置大法。附赠两套高质量提示词模板及RunningHub免费48G算力羊毛,低配党速冲!

一、LTX2.0低配可玩版介绍

LTX 2.0 显存暴降!8G 就能跑音画同步?低配优化版教程来了!

LTX 2.0 显存暴降!8G 就能跑音画同步?低配优化版教程来了!

前天分享过LTX2.0这个最新的支持音画同步的视频模型,文生视频这块非常的给力,但是只看的版本对显存要求太高了,导致大家本地玩不了。

这不,社区最近迭代的很快,挖掘出来最低8G可玩的版本,可以跑8秒或者16秒视频,今天就给大家整理了下如何优化,另外给大家2个更加优质的提示词模板,助力大家起飞!

先看个我跑的8秒视频

二、相关安装

要想本地低配电脑12G-16G显存可以玩LTX2.0,至少要做如下三个方面的准备。

首先要安装下面这个插件

低显存插件:https://github.com/Windecay/ComfyUI-ReservedVRAM

这个是必装的,可以让大家低显存也可以跑这个LTX2.0,具体使用在工作流部分介绍。

然后要下载CLIP的FP8的模型,这个提供在网盘了,之前很多人本地在加载gemma原模型22G的时候就爆了,现在FP8的只要12G

LTX 2.0 显存暴降!8G 就能跑音画同步?低配优化版教程来了!

LTX 2.0 显存暴降!8G 就能跑音画同步?低配优化版教程来了!

最后,你至少要有32G的内存,64G更好,并且需要设置下虚拟内存,要设置成你内存的2倍左右,我是设置100G大小。

具体设置看截图。

LTX 2.0 显存暴降!8G 就能跑音画同步?低配优化版教程来了!

LTX 2.0 显存暴降!8G 就能跑音画同步?低配优化版教程来了!

按下图这样打开虚拟内存设置的地方,我是G盘运行ComfyUI的,所以我设置在G盘,我这里是设置了128G的大小, 128x1024=131072,大家可以设置内存的2倍就行,如果是32G内存,那就是32x1024=32768。

LTX 2.0 显存暴降!8G 就能跑音画同步?低配优化版教程来了!

LTX 2.0 显存暴降!8G 就能跑音画同步?低配优化版教程来了!

设置好了,要确定下,然后重启下电脑就行,这样虚拟内存高了,就不容易爆了。

另外给大家说个好消息啊,RunningHub上面目前非会员也可以跑48G显存啦,就是点击黄色的运行按钮,这个就是对应48G显存。

LTX 2.0 显存暴降!8G 就能跑音画同步?低配优化版教程来了!

LTX 2.0 显存暴降!8G 就能跑音画同步?低配优化版教程来了!

三、测评体验

LTX 2.0 显存暴降!8G 就能跑音画同步?低配优化版教程来了!

LTX 2.0 显存暴降!8G 就能跑音画同步?低配优化版教程来了!

工作流和最早分享的差不多,我就说一下差异的地方

首先是模型这边,多了一个Set Reserved VRAM(GB) 节点,这个可以强制预留一定的显存,这样就可以在低显存电脑上跑啦,入参设置4,mode模式改成手动manual即可。

然后就是gemma这个模型,选我们最新的fp8的就可以了。

LTX 2.0 显存暴降!8G 就能跑音画同步?低配优化版教程来了!

LTX 2.0 显存暴降!8G 就能跑音画同步?低配优化版教程来了!

入参这边设置3个地方机型,一个是分辨率、一个是时长(秒)、以及提示词。

LTX 2.0 显存暴降!8G 就能跑音画同步?低配优化版教程来了!

LTX 2.0 显存暴降!8G 就能跑音画同步?低配优化版教程来了!

提示词这边结合了大模型,我这里继续用魔搭这个插件:

LTX 2.0 显存暴降!8G 就能跑音画同步?低配优化版教程来了!

LTX 2.0 显存暴降!8G 就能跑音画同步?低配优化版教程来了!

另外给大家两段我调试的提示词,搭配使用效果更好,分别针对8秒和16秒的:

8秒版本:

# Role
你是一名 LTX-2 电影级视频提示词专家。你的任务是根据用户输入的【场景】和【中文对话】,创作一段 500 字以内的**单段式、高度连贯**的英文视频提示词。

# Task Logic
1. **视觉动作流**:按照【开场环境与动作 -> 核心对白与微表情 -> 情绪收尾】的逻辑编写。
2. **声画融合**:将音效描述自然地嵌入到动作描写中。
3. **中文保留**:画面描述用英文,人物对话直接原样保留中文。

# Prompt Requirements (遵循 LTX-2 官方规范)
- **Fluid Paragraph**: 严禁分段,严禁使用 Shot 1/2 标签,必须是一段流利的英文叙述。
- **Direct Action**: 第一句话必须描述一个明确的视觉动态。
- **Physical Details**: 强调材质质感、光影变化(Volumetric lighting, SSS skin textures)。
- **Cinematic Movement**: 包含具体的运镜(如 Slow zoom, Handheld shake, Tracking shot)。

# 输出格式示例

直接输出扩写后的单段提示词,不要任何开场白或解释,格式如下:
A cinematic tracking shot begins with [动作描写]. The environment is filled with [环境细节], illuminated by [灯光]. As the character [具体动作], the sound of [音效描述] is clearly heard. Transitioning into a tight close-up, the character's facial muscles twitch as they say: "[此处插入原始中文对话]". The scene concludes with [运镜变化] showing [收尾画面], while the ambient sound of [音效] lingers.

# 示例输出参考(武侠场景)

用户输入:
场景:一个武侠剑客在竹林里喝酒。
对话:“好酒,可惜是断头酒。”

输出:
用标准普通话,
The scene opens with a sharp medium shot of a swordsman in weathered white silk robes leaning against a moist bamboo stalk, his fingers gripping a rough ceramic wine jar. Sunlight filters through the dense canopy in volumetric beams, catching the swirling mist and falling bamboo leaves. As he tilts his head back to pour the amber liquid, the audible rhythmic splashing sound of wine accompanies the movement. The camera dollys in rapidly to an extreme close-up of his face, capturing the glisten of moisture on his lips and the flicker of sorrow in his sharp eyes. He pauses, his Adam'
s apple bobbing, and says in a low, raspy voice: "好酒,可惜是断头酒。" Simultaneously, the wind howls through the hollow bamboo with a haunting whistle. The shot ends with a slow orbit around his hand as it tightens on the rusted sword hilt, accompanied by the creaking sound of old leather.

16秒版本:

# Role
你是一名资深 LTX-2 电影导演和提示词架构师,擅长编写长达 16秒 的复杂长镜头提示词。你能将简单的场景转化为具有“起、承、转、合”完整叙事链条的英文电影脚本。
# Task Logic (16秒五段式架构)
由于视频长度增加至16秒,你的描述必须包含以下五个逻辑阶段,并将其融合成一段流畅的叙事:
Prologue (0-4s):环境建立与初始动态。描述远景或中景的镜头切入,确立光影基调。
Development (4-8s):细节推进与物理互动。主体开始进行复杂的预备动作(如整理衣物、观察四周、物品交互)。
Climax/Dialogue (8-12s):核心对白与面部特写。镜头推至近景,捕捉极细腻的肌肉抽动与眼神变化,并嵌入对话。
Transition (12-14s):动作的物理后果。描述对白后的后续动态(如垂头、苦笑、泪水滑落或环境的剧烈变动)。
Epilogue (14-16s):远离或定格。镜头缓慢拉开或旋转,氛围音效收尾。
# Prompt Requirements
Fluid Paragraph: 严禁分段,严禁使用标签。必须是一段约 300-500 字的流利英文叙述。
Time Pacing: 使用 "Gradually", "Slowly", "Then", "In a continuous motion" 等词汇引导 16 秒的节奏感。
Audio Integration: 在动作发生点自然嵌入音效和中文对话。
Visual Style: 强调电影级光影(Cinematic lighting, SSS, Volumetric effects)。
# 输出格式
直接输出扩写后的单段提示词,开头标注语音要求。
🚀 示例展示(16秒长镜头版)
用户输入:
场景:废土世界的机械师在修理破旧的收音机,突然听到了微弱的信号音。
对话:“这破世界,竟然还没死绝。”
输出:
用标准普通话,
The 16-second cinematic sequence opens with a slow, shaky handheld tracking shot across a cluttered, rusty workbench filled with flickering vacuum tubes and copper wires in a desolate wasteland shelter. In the first four seconds, sunlight thick with volumetric dust motes streaks through the cracked ceiling, illuminating the grease-stained fingers of a mechanic as he meticulously adjusts a copper dial. As the scene progresses into the eighth second, the mechanic leans in closer, his heavy breathing audible beneath the low hum of wind outside; he suddenly freezes as a sharp, static-filled signal chirps from the old radio, creating a high-pitched metallic buzz. The camera performs a slow, tension-filled rack focus to his face, capturing the intricate grime in his pores and the sudden trembling of his eyelids. By the twelfth second, in a tight extreme close-up, his dry lips part and he murmurs in a gravelly, weary voice: "这破世界,竟然还没死绝。" Following the dialogue, a single tear tracks through the soot on his cheek while the radio signal dissolves into a hauntingly clear melody. The shot concludes in the final seconds as the camera slowly dollys back, revealing the vast, silent ruins outside the window, while the ambient sound of crackling electricity and a mournful cello theme lingers until the screen fades.
案例展示

下面是我尝试的一些8秒是16秒视频,提示词都是最原始没经过大模型扩写的

场景:一个女子坐在轿车里面后座上,车辆在马路上缓慢行驶并加速,车子侧面有一个中年男性在后面追赶,边追赶边抬手做出挽留动作。
对话:男子喊到:“燕子,你不要走,没有你我该怎么活呀”
场景:一个男人误入了一个原始森林探险,结果看到了霸王龙,他躲在树后瑟瑟发抖,期待霸王龙离开,结果霸王龙是走开了,但是当他转身想找的时候,突然发现霸王龙就在它身后,他吓得躺坐在地上,喊了一句:"晚了,吾命休矣"
场景描述:深夜的洗手间,水龙头滴答作响。一个女人正在疯狂地用冷水洗脸,试图清醒。当她抬起头看向镜子时,镜子里的她并没有动,而是保持着低头洗脸的姿势。女人愣住了,缓缓后退,镜子里的“她”此时却慢慢抬起头,露出了一个极其诡异且僵硬的微笑,并伸手按在了镜面内侧,发出了玻璃摩擦的刺耳声。
对话:“别怕,我这就出来陪你。”
场景描述:大雪纷飞的塞外战场,遍地断戟。一位满头白发的老将军拄着残破的长剑,靠在烧了一半的军旗杆下。远处传来了密集的马蹄声,地面的积雪在震动。他颤抖着从怀里掏出一块染血的玉佩看了最后一眼,随后猛地抬头,浑浊的双眼瞬间变得犀利如电,单手撑地想要站起,却发现双腿已冻死在冰土里。
对话:“这江山,终究没能守住。”

效果还是很不错的,接下来就等社区继续挖掘更多新东西了。



您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

© 2001-2026 BBS.Monster