|
|
CosyVoice3一键包,多音字控制,音色保存,接口API调用,流式接口,支持50系显卡,6G显存可用,接入开源阅读,文字转语音,TTS,阿里开源
接口格式:http://localhost:9880/?text=你好,测试一下&speaker=jok老师&instruct=使用四川话
其他参数:streaming=1
关键点:
1
00:00:08,933 --> 00:00:09,800
大家好
2
00:00:09,833 --> 00:00:12,800
阿里最新开源的 CosyVoice3 语音模型
3
00:00:13,466 --> 00:00:15,966
双击 开始 自动启动接口服务
4
00:00:16,566 --> 00:00:19,033
这里可以选择使用参考音频
5
00:00:25,466 --> 00:00:26,933
可以听到有底噪
6
00:00:27,533 --> 00:00:28,933
点击可以降噪
7
00:00:35,000 --> 00:00:37,233
设备是 4060 笔记本
8
00:00:37,266 --> 00:00:39,033
显存占用6G左右
9
00:01:51,133 --> 00:01:53,233
可以选择语言控制模式
10
00:02:25,866 --> 00:02:27,200
可以保存音色
11
00:02:40,200 --> 00:02:42,300
下一次使用预训练音色
12
00:02:46,733 --> 00:02:49,000
这里可以控制多音字的念法
13
00:03:04,000 --> 00:03:06,033
可以直接使用接口服务
14
00:03:19,433 --> 00:03:20,500
流式接口
15
00:03:39,666 --> 00:03:41,100
文本指令接口
16
00:03:54,366 --> 00:03:56,500
配置开原阅读朗读引擎
17
00:05:27,733 --> 00:05:29,700
以上,感谢您的观看
18
00:05:29,766 --> 00:05:31,700
这里是刘悦的技术博客
-
CosyVoice3一键包,多音字控制,音色保存,接口API调用,流式接口
|
|