73

主题

-9

回帖

324

修为

创始合伙人

积分
625
Qwen3-TTS,多人对话,智能多音字,4G显存可用,英文念法优化,批量任务,音色保存,接口API调用,支持超长文本,支持50系显卡,支持老显卡


Qwen3-TTS,多人对话,智能多音字,4G显存可用,英文念法优化,批...

Qwen3-TTS,多人对话,智能多音字,4G显存可用,英文念法优化,批...




关键点:


1
00:00:08,933 --> 00:00:09,766
大家好

2
00:00:09,800 --> 00:00:12,800
针对 qwen3 TTS 语音模型做了更新

3
00:00:13,400 --> 00:00:16,600
增加智能多音字系统,增加多人对话

4
00:00:16,666 --> 00:00:18,900
优化了英文一些缩写的读音

5
00:00:19,566 --> 00:00:20,666
双击开始

6
00:00:21,266 --> 00:00:23,100
默认使用参考音频

7
00:00:30,733 --> 00:00:32,933
设备是 4060 笔记本

8
00:00:32,966 --> 00:00:34,733
显存占用3G左右

9
00:00:51,033 --> 00:00:52,866
这里可以设置多音字

10
00:00:52,866 --> 00:00:55,000
改成了更简单方便的格式

11
00:00:55,666 --> 00:00:57,433
支持直接输入拼音

12
00:00:57,433 --> 00:00:59,500
适合同一个词反复出现

13
00:00:59,566 --> 00:01:01,133
但读音不同的场景

14
00:01:09,833 --> 00:01:11,466
也可以和英文混读

15
00:01:11,466 --> 00:01:13,100
不影响英文的发音

16
00:01:24,333 --> 00:01:25,400
保存音色

17
00:01:40,566 --> 00:01:43,266
这里可以根据文字指令设计音色

18
00:02:11,933 --> 00:02:13,566
这里可以多人对话

19
00:02:15,533 --> 00:02:17,466
这里调整停顿的间隙

20
00:02:39,833 --> 00:02:41,700
这里是批量任务模版

21
00:02:52,333 --> 00:02:53,733
运行批量任务

22
00:03:18,133 --> 00:03:20,100
以上,感谢您的观看

23
00:03:20,133 --> 00:03:22,066
这里是刘悦的技术博客


昨天 21:09 上传
下载次数:
0
Qwen3-TTS,多人对话,智能多音字,4G显存可用,英文念法优化,批...
本地下载
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则