简体中文 English 日本語 Русский язык 한어

108

主题

-9

回帖

530

修为

创始合伙人

积分
998
OmniVoice,接口api使用,支持600种语言,4G显存可用,速度1比0.3,文本指令,支持呻吟笑声,文字转语音,支持超长文本,声音克隆,小米k2-fsa团队开源

OmniVoice,接口api使用,支持600种语言,4G显存可用,速度1比0.3,文...

OmniVoice,接口api使用,支持600种语言,4G显存可用,速度1比0.3,文...


接口格式:http://localhost:9880/?text=测试测试,这里是测试&speaker=叶奈法
其他参数 instruct=女,河南话,少年  speed=0.8  lang=en novasr=1
线上镜像地址:https://www.compshare.cn/images/ ... _yy_bilibili_lyblog



关键点:

1
00:00:08,933 --> 00:00:09,766
大家好

2
00:00:09,833 --> 00:00:13,466
小米 卡拉迪团队最新开源的声音模型 OmniVoice

3
00:00:14,066 --> 00:00:16,666
这个模型的特点是速度非常快

4
00:00:16,766 --> 00:00:19,466
且支持文本指令和600种语言

5
00:00:19,566 --> 00:00:21,166
适合甜品卡使用

6
00:00:21,866 --> 00:00:24,366
双击开始 自动启动接口服务

7
00:00:29,033 --> 00:00:30,700
默认使用参考音频

8
00:00:43,600 --> 00:00:45,866
设备是 4060 笔记本

9
00:00:45,866 --> 00:00:47,666
显存占用 3G 左右

10
00:01:02,466 --> 00:01:04,600
这里支持文本指令控制

11
00:01:33,000 --> 00:01:34,533
这里控制多音字

12
00:01:44,766 --> 00:01:47,500
这里支持一些你懂的副文本指令

13
00:02:17,866 --> 00:02:19,300
选择其他语种

14
00:03:58,766 --> 00:04:00,166
保存音色模型

15
00:04:11,366 --> 00:04:13,533
也可以直接使用接口服务

16
00:04:19,266 --> 00:04:21,533
配置开源阅读的朗读引擎

17
00:04:22,166 --> 00:04:24,133
以上,感谢您的观看

18
00:04:24,166 --> 00:04:26,100
这里是刘悦的技术博客


2 小时前 上传
下载次数:
0
OmniVoice,接口api使用,支持600种语言,4G显存可用,速度1比0.3,文...
本地下载
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

简体中文
繁體中文
English(英语)
日本語(日语)
Deutsch(德语)
Русский язык(俄语)
بالعربية(阿拉伯语)
Türkçe(土耳其语)
Português(葡萄牙语)
ภาษาไทย(泰国语)
한어(朝鲜语/韩语)
Français(法语)
QQArchiver手机版小黑屋粤ICP备2026002389号-1粤ICP备2026002389号-1 简体中文 English 日本語 Русский язык 한어 |网站地图