刘悦的技术博客 发表于 2025-9-13 14:00:00

HeyGem数字人优化加速版,原生支持50系显卡,4G显存占用

HeyGem数字人优化加速版,支持面部角色保存,支持API接口调用,支持原始分辨率和帧率,GFPGAN超分,修复多面部报错,推理速度1比2,唱歌数字人_哔哩哔哩_bilibili


https://www.bilibili.com/video/BV1Rop7z2EnG?spm_id_from=333.788.videopod.sections&vd_source=0e37e42fa2c41d590d6021324a99c28d

大家好,本次为大家分享最新版 HeyGem 数字人。该版本修复了此前反馈的两项问题,分别是面部超分无法关闭的问题与批次推理无法更改的问题,同时新增了角色保存和 API 接口调用等功能。操作启动方式为双击,双击后系统会自动开启接口服务。在使用过程中,系统默认采用上传的视频;若提前保存角色,下次使用时则无需再次上传视频。

本次演示所使用的设备为 4060 笔记本,设备运行时显存占用约 3G。关于超分模型,系统支持关闭该功能,且开启超分模型会额外增加推理时间;若视频中的角色本身已足够清晰,则无需开启超分模型。此外,该版本支持直接访问接口地址,涵盖本地物理地址与网络地址,系统会自动下载对应视频及音频,同时依然支持批量任务处理。以上就是本次分享的内容,感谢您的观看。此处为刘悦的技术博客。



[*] 核心分享内容:最新版 HeyGem 数字人
[*] 版本修复内容①:修复面部超分无法关闭的问题
[*] 版本修复内容②:修复批次推理无法更改的问题
[*] 版本新增功能:增加角色保存和 API 接口调用功能
[*] 操作与服务开启:双击启动,系统自动开启接口服务
[*] 视频使用默认设置:默认使用上传的视频
[*] 角色保存效果:保存角色后,下次使用无需上传视频
[*] 超分模型操作:支持关闭超分模型
[*] 演示设备信息:使用 4060 笔记本
[*] 显存占用情况:4060 笔记本运行时显存占用约 3G
[*] 超分模型影响:开启超分模型会额外增加推理时间
[*] 超分模型使用建议:视频角色本身清晰时,无需开启超分模型
[*] 接口地址支持:支持直接访问接口地址,含本地物理地址和网络地址
[*] 音视频处理:系统会自动下载视频与音频
[*] 任务处理能力:依然支持批量任务
[*] 内容来源:刘悦的技术博客


刘悦的技术博客 发表于 2025-9-23 00:39:13

接口格式:
curl -X 'GET' \
'http://localhost/?audio_file=音频地址(支持网络地址和物理地址)&video_file=视频地址(支持网络地址和物理地址)&ifface=false&if_gfpgan=false&steps=4' \
-H 'accept: application/json'ifface 是否使用原始视频的分辨率和帧率,如果false,那么用 720P 和24帧 加速

if_gfpgan 是否gfpgan面部超分增强

steps 批次处理次数,越大越快,但是容易爆显存
页: [1]
查看完整版本: HeyGem数字人优化加速版,原生支持50系显卡,4G显存占用