|
|
Qwen3-TTS,NovaSr音频增强支持48khz高音质,温度调节,多人对话,智能多音字,4G显存可用,批量任务,接口API调用,支持超长文本,支持50系显卡,支持老显卡
线上镜像: https://www.compshare.cn/images/ ... _yy_bilibili_lyblog
接口格式:http://localhost:9880/?text=你好,测试一下&speaker=老男人
其他参数:chunk=200 batch=8 speed=1 lang=English model=0.6B novasr=1 temperature=0.6
Qwen3-TTS,NovaSr音频增强支持48khz高音质,温度调节,多人对话,...
关键点:
1
00:00:08,900 --> 00:00:12,066
大家好,针对 Qwen3 tts 做了更新
2
00:00:12,600 --> 00:00:16,366
针对老显卡 flash attn 编译报错问题做了修复
3
00:00:17,000 --> 00:00:22,033
针对官方 24000 hz 低品质音质和音量过小问题做了修复
4
00:00:22,033 --> 00:00:24,833
增加 NovaSr 音频超分增强模型
5
00:00:24,866 --> 00:00:27,333
支持 48000 hz 采样率输出
6
00:00:27,366 --> 00:00:28,366
提升音质
7
00:00:29,033 --> 00:00:32,300
增加温度控制,让推理结果更稳定
8
00:00:32,866 --> 00:00:34,666
增加音色列表接口
9
00:00:34,666 --> 00:00:36,300
可以直接接入酒馆
10
00:00:36,900 --> 00:00:39,466
双击 开始 自动启动接口服务
11
00:00:40,000 --> 00:00:41,833
默认使用参考音频
12
00:00:48,600 --> 00:00:50,300
这里可以控制温度
13
00:00:52,233 --> 00:00:54,466
设备是 4060 笔记本
14
00:00:54,466 --> 00:00:56,266
显存占用 3G 左右
15
00:01:11,666 --> 00:01:12,733
保存音色
16
00:01:43,500 --> 00:01:45,900
默认是 24000 hz 采样率
17
00:01:46,466 --> 00:01:49,733
点击 音频增强,也可以勾选自动增强
18
00:02:08,633 --> 00:02:10,900
结果音质和音量得到提升
19
00:02:10,966 --> 00:02:12,366
采样率得到提升
20
00:02:13,466 --> 00:02:14,900
支持多人对话
21
00:02:38,600 --> 00:02:39,966
支持批量任务
22
00:02:40,666 --> 00:02:42,366
可以直接访问接口
23
00:02:53,666 --> 00:02:55,666
接口支持返回音色列表
24
00:02:56,566 --> 00:02:58,600
以上,感谢您的观看
25
00:02:58,600 --> 00:03:00,733
这里是刘悦的技术博客
- 下载次数:
- 0
- Qwen3-TTS,NovaSr音频增强支持48khz高音质,温度调节,多人对话,...
-
本地下载
-
Qwen3-TTS,NovaSr音频增强支持48khz高音质,温度调节,多人对话,...
|
|