|
|
Qwen3-ASR-1.7B,语音转文字字幕,视频转字幕,4G显存可用,支持50系显卡,批量任务,支持热词控制
线上镜像: https://www.compshare.cn/images/ ... _yy_bilibili_lyblog
Qwen3-ASR-1.7B,语音转文字字幕,视频转字幕,4G显存可用,支持50...
关键点:
1
00:00:08,900 --> 00:00:09,800
大家好
2
00:00:09,833 --> 00:00:13,766
阿里开源的 Qwen3-ASR 1.7B 语音转写模型
3
00:00:14,433 --> 00:00:17,933
这个模型可以快速将语音转写文本和字幕
4
00:00:17,966 --> 00:00:19,166
而且速度快
5
00:00:19,233 --> 00:00:20,266
准确率高
6
00:00:20,900 --> 00:00:22,366
支持热词控制
7
00:00:23,000 --> 00:00:24,100
双击开始
8
00:00:26,000 --> 00:00:27,100
素材选择
9
00:00:42,233 --> 00:00:44,466
设备是 4060 笔记本
10
00:00:44,466 --> 00:00:46,266
显存占用 3G 左右
11
00:00:49,866 --> 00:00:50,833
可以看到
12
00:00:50,833 --> 00:00:53,300
一些同音词的转写是有错误的
13
00:00:53,966 --> 00:00:56,333
输入指定的热词,并保存
14
00:01:06,033 --> 00:01:07,533
错误已经被修正
15
00:01:08,066 --> 00:01:09,966
也可以选择字幕文件
16
00:01:46,966 --> 00:01:49,266
在生成结果目录找到文件
17
00:01:54,633 --> 00:01:55,733
视频转写
18
00:03:06,833 --> 00:03:08,200
这里上传电影
19
00:03:08,200 --> 00:03:10,300
有的格式浏览器无法播放
20
00:03:10,300 --> 00:03:13,066
不用管,直接点转写按钮即可
21
00:03:49,633 --> 00:03:52,566
使用 comfyui 就访问 自定义的端口号
22
00:03:53,233 --> 00:03:55,200
以上,感谢您的观看
23
00:03:55,266 --> 00:03:57,200
这里是刘悦的技术博客
- 下载次数:
- 0
- Qwen3-ASR-1.7B,语音转文字字幕,视频转字幕,4G显存可用,支持50...
-
本地下载
|
|