|
|
OmniVoice,接口api使用,支持600种语言,4G显存可用,速度1比0.3,文本指令,支持呻吟笑声,文字转语音,支持超长文本,声音克隆,小米k2-fsa团队开源
OmniVoice,接口api使用,支持600种语言,4G显存可用,速度1比0.3,文...
接口格式:http://localhost:9880/?text=测试测试,这里是测试&speaker=叶奈法
其他参数 instruct=女,河南话,少年 speed=0.8 lang=en novasr=1
线上镜像地址:https://www.compshare.cn/images/ ... _yy_bilibili_lyblog
关键点:
1
00:00:08,933 --> 00:00:09,766
大家好
2
00:00:09,833 --> 00:00:13,466
小米 卡拉迪团队最新开源的声音模型 OmniVoice
3
00:00:14,066 --> 00:00:16,666
这个模型的特点是速度非常快
4
00:00:16,766 --> 00:00:19,466
且支持文本指令和600种语言
5
00:00:19,566 --> 00:00:21,166
适合甜品卡使用
6
00:00:21,866 --> 00:00:24,366
双击开始 自动启动接口服务
7
00:00:29,033 --> 00:00:30,700
默认使用参考音频
8
00:00:43,600 --> 00:00:45,866
设备是 4060 笔记本
9
00:00:45,866 --> 00:00:47,666
显存占用 3G 左右
10
00:01:02,466 --> 00:01:04,600
这里支持文本指令控制
11
00:01:33,000 --> 00:01:34,533
这里控制多音字
12
00:01:44,766 --> 00:01:47,500
这里支持一些你懂的副文本指令
13
00:02:17,866 --> 00:02:19,300
选择其他语种
14
00:03:58,766 --> 00:04:00,166
保存音色模型
15
00:04:11,366 --> 00:04:13,533
也可以直接使用接口服务
16
00:04:19,266 --> 00:04:21,533
配置开源阅读的朗读引擎
17
00:04:22,166 --> 00:04:24,133
以上,感谢您的观看
18
00:04:24,166 --> 00:04:26,100
这里是刘悦的技术博客
- 下载次数:
- 0
- OmniVoice,接口api使用,支持600种语言,4G显存可用,速度1比0.3,文...
-
本地下载
|
|