57

主题

6

回帖

298

贡献

创始合伙人

积分
3375
t8star 2025-9-24 01:52:39 | 显示全部楼层 | 阅读模式
Ai音频8-这确定不是真人说的?小红书开源FireRedTTS2,乱神版好用又好安装的IndexTTS2,波形视频节点dotWaveform-Comfyui教程_哔哩哔哩_bilibili



Part 1: 概括文章
這部影片介紹了T8star-Aix頻道發布的關於AI語音合成技術FireRedTTS2的教程。作者首先展示了FireRedTTS2生成的一段聽起來像真人說話的語音,其中包含口吃、停頓等自然語氣,並強調其真實性。影片介紹了由CF作者復興的第二代FireRedTTS2,以及來自R亂神的IndexTTS2,這兩個工具都方便安裝且效果良好。
影片還介紹了兩個重要的ComfyUI節點:
  • dotWaveform (DWform): 這是一個波形動畫節點,提供五種動畫效果,可以為影片製作簡單的場景或特效,且生成速度非常快。
  • IndexTTS2 (亂神版): 這款工具支持無限連接,可以同時參考多個音頻來合成新語音。它特別實用的一個功能是能夠添加停頓,這使得合成語音更具真實感,尤其是在雙人對話中。此外,它還考慮到低顯存需求,允許卸載模型以節省顯存。作者還演示了如何調整情緒向量來改變語音的情感,並提醒用戶避免將情緒設置得過高,以免影響音色。
最後,作者介紹了RHub AI工作台,這是一個免費的平台,提供影片中使用的所有工作流,並鼓勵觀眾註冊使用。


Part 2: 知識提取
  • [01:26] 亂神開發的IndexTTS2節點非常易於安裝,並且支持多種音色、向量的串聯,具有很強的可執行性。
  • [02:32] IndexTTS2有一個實用功能,可以通過添加停頓(如0.5秒)來增加語音的真實感。
  • [03:55] dotWaveform工作流提供五種動畫方式,可用於為影片添加波形動畫特效,且生成速度快。
  • [06:55] 亂神的IndexTTS2支持無限連接,可以同時參考多個音頻(reference audio s)來進行語音合成。
  • [07:35] 該節點考慮到低顯存需求,可以勾選「卸載模型」來降低顯存佔用。[
  • 08:15] 該工具允許將多個情緒(emotions)混合在一起進行語音合成。


https://github.com/1038lab/ComfyUI-FireRedTTShttps://github.com/FireRedTeam/FireRedTTS2[url]https://github.com/yolain/ComfyUI-Easy-IndexTTS2[url=https://github.com/Saganaki22/ComfyUI-dotWaveform]https://github.com/Saganaki22/ComfyUI-dotWaveform[/url][/url]记得给作者点个star,赠人玫瑰,手留余香


您需要登录后才可以回帖 登录 | 立即注册

本版积分规则