-
Qwen3-TTS-1.7B,6G显存可用,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS,阿里开源,自定义端口
线上镜像:https://www.compshare.cn/images/aRYMV4DwR ...
-
HeartMuLa音乐歌曲生成3B版V1
https://www.runninghub.cn/post/2013497255407390722/?inviteCode=rh-v1121
(RL强化版)HeartMuLa音乐歌曲生成3B版V1
https://www.runninghub.cn/post/2014941704297648129/?invit ...
-
阿里Qwen3-TTS重磅发布!不仅支持毫秒级超低延迟,更带来四大王炸功能:高保真语音克隆、自由语音设计、超类人自然发音以及基于自然语言的精准语音控制。想哭想笑、语速快慢,一句Prompt全搞定,语音生成迈入“捏脸 ...
-
Suno平替来了?HeartMuLa开源人工智能音乐基础模型重磅发布!打破闭源垄断,支持Text-to-Music高质量生成。无论是背景音乐、配乐还是歌曲创作,均可本地部署,实现真正的“音乐创作自由”。开源社区的春天已至!
一 ...
-
流在评论区置顶链接,点开即玩
https://github.com/QwenLM/Qwen3-TTShttps://github.com/flybirdxx/ComfyUI-Qwen-TTS模型:https://pan.quark.cn/s/7f0a47bbdfdb感谢@Smile-ii @HAIGC 制作节点
T8教学工作 ...
-
Vevo1.5音频内容修改,歌曲改词,改歌词,语音内容修改,时长对齐,8G显存可用,支持50系
具体视频内容:
1
00:00:08,866 --> 00:00:09,733
大家好
2
00:00:09,733 --> 00:00:12,700
分享 基于 Vevo 1.5 的音频 ...
-
HeartMuLa一键包,AI歌曲生成,开源版Suno,支持50系显卡,8G显存可用,Comfyui
关键点:
1
00:00:08,933 --> 00:00:09,766
大家好
2
00:00:09,800 --> 00:00:12,666
HeartMuLa 团队开源的 歌曲生成模型
3
00:00 ...
-
HeartMuLa音乐歌曲生成3B版V1
https://www.runninghub.cn/post/2013497255407390722/?inviteCode=rh-v1121
HeartMuLa音频歌词提取
https://www.runninghub.cn/post/2013499135474802689/?inviteCode=rh-v1121
粉 ...
-
Wan2.2-SmoothMix,更丝滑的图生视频(NSFW),首尾帧连贯动画,4步采样,8G显存可用,支持50系,支持批量任务,Comfyui,工作流
Wan2.2-SmoothMix:https://pan.quark.cn/s/d6d8b4246307
大家好!今天我将为大家分享一 ...
-
转自 通义大模型
只需3秒录音,就能让你的声音无缝切换语种、方言与情绪——中、粤、日、英、开心、愤怒......9 种通用语言、18种方言,通通搞定!一段嘈杂环境下的会议录音,AI 也能毫秒级输出文字,绕口令、RAP、 ...
-
智谱正式发布并开源了GLM-ASR系列语音识别模型,并推出基于该系列模型打造的桌面端智谱AI输入法。
本次发布模型与产品包括:
[*]GLM-ASR-2512:全球领先的云端语音识别模型;
[*]GLM-ASR-Nano-2512:参数量仅1.5B ...
-
CosyVoice3一键包,多音字控制,音色保存,接口API调用,流式接口,支持50系显卡,6G显存可用,接入开源阅读,文字转语音,TTS,阿里开源
接口格式:http://localhost:9880/?text=你好,测试一下&speaker=jok老师&instruct=使用 ...