52

主题

-9

回帖

197

修为

创始合伙人

积分
390
CosyVoice3一键包,多音字控制,音色保存,接口API调用,流式接口,支持50系显卡,6G显存可用,接入开源阅读,文字转语音,TTS,阿里开源
接口格式:http://localhost:9880/?text=你好,测试一下&speaker=jok老师&instruct=使用四川话
其他参数:streaming=1





关键点:

1
00:00:08,933 --> 00:00:09,800
大家好

2
00:00:09,833 --> 00:00:12,800
阿里最新开源的 CosyVoice3 语音模型

3
00:00:13,466 --> 00:00:15,966
双击 开始 自动启动接口服务

4
00:00:16,566 --> 00:00:19,033
这里可以选择使用参考音频

5
00:00:25,466 --> 00:00:26,933
可以听到有底噪

6
00:00:27,533 --> 00:00:28,933
点击可以降噪

7
00:00:35,000 --> 00:00:37,233
设备是 4060 笔记本

8
00:00:37,266 --> 00:00:39,033
显存占用6G左右

9
00:01:51,133 --> 00:01:53,233
可以选择语言控制模式

10
00:02:25,866 --> 00:02:27,200
可以保存音色

11
00:02:40,200 --> 00:02:42,300
下一次使用预训练音色

12
00:02:46,733 --> 00:02:49,000
这里可以控制多音字的念法

13
00:03:04,000 --> 00:03:06,033
可以直接使用接口服务

14
00:03:19,433 --> 00:03:20,500
流式接口

15
00:03:39,666 --> 00:03:41,100
文本指令接口

16
00:03:54,366 --> 00:03:56,500
配置开原阅读朗读引擎

17
00:05:27,733 --> 00:05:29,700
以上,感谢您的观看

18
00:05:29,766 --> 00:05:31,700
这里是刘悦的技术博客




CosyVoice3一键包,多音字控制,音色保存,接口API调用,流式接口

CosyVoice3一键包,多音字控制,音色保存,接口API调用,流式接口
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

© 2001-2025 BBS.Monster