预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113886551A(43)申请公布日2022.01.04(21)申请号202111210925.5H04N21/44(2011.01)(22)申请日2021.10.18(71)申请人深圳追一科技有限公司地址518000广东省深圳市南山区粤海街道科技园社区科苑路8号讯美科技广场3号楼23A、23B(72)发明人常向月王雨辰穆少垒(74)专利代理机构北京集佳知识产权代理有限公司11227代理人张倩(51)Int.Cl.G06F16/332(2019.01)G06F16/33(2019.01)G06F16/957(2019.01)G06F16/958(2019.01)权利要求书2页说明书10页附图5页(54)发明名称数字人渲染方法及装置、存储介质及电子设备(57)摘要本发明提供一种数字人渲染方法及装置、存储介质及电子设备,该方法包括:获取客户输入的交互数据;将交互数据发送至中控系统进行处理;获得中控系统反馈的渲染协议数据,将渲染协议数据中的应答音频数据存入第一渲染队列,将渲染协议数据中的嘴型数据存入第二渲染队列;读取第一渲染队列和第二渲染队列中的数据,基于读取到的嘴型数据在客户端的H5展示页面渲染数字人,基于读取到的应答音频数据播放音频。获取中控系统对交互数据处理生成的渲染协议数据,基于渲染协议数据中的应答音频数据和嘴型数据在H5展示页面渲染数字人和播放音频。在H5展示页面渲染数字人的对客户端的软硬件要求低,不需要占用大量的服务器资源,降低了渲染数字人的成本。CN113886551ACN113886551A权利要求书1/2页1.一种数字人渲染方法,其特征在于,应用于客户端,包括:获取客户输入的交互数据;将所述交互数据发送至预设的中控系统,以触发所述中控系统对所述交互数据进行处理,得到渲染协议数据;获得所述中控系统反馈的所述渲染协议数据,对渲染协议数据进行解析,获得应答音频数据和嘴型数据;将所述应答音频数据保存至第一渲染队列中,以及将所述嘴型数据保存至第二渲染队列中;同步读取所述第一渲染队列和所述第二渲染队列中的数据,并基于读取到的嘴型数据在所述客户端的H5展示页面渲染数字人,以及基于读取到的应答音频数据播放音频。2.根据权利要求1所述的方法,其特征在于,所述将所述交互数据发送至预设的中控系统,包括:基于预设的网络模块的通信方式,将所述交互数据发送至网关,使得所述网关将所述交互数据转发至所述中控系统。3.根据权利要求1所述的方法,其特征在于,所述触发所述中控系统对所述交互数据进行处理,得到渲染协议数据,包括:所述中控系统将所述交互数据输入预设的交互应答模块,触发所述交互应答模块对所述交互数据进行处理,得到与所述交互数据对应的应答音频数据;所述中控系统获取所述交互应答模块反馈的应答音频数据,并调用预设的嘴型推理模块对所述应答音频数据进行处理,获得所述嘴型推理模块输出的与所述应答音频数据对应的嘴型数据;所述中控系统将所述应答音频数据和嘴型数据封装成渲染协议数据。4.根据权利要求3所述的方法,其特征在于,所述触发所述交互应答模块对所述交互数据进行处理,得到与所述交互数据对应的应答音频数据,包括:基于所述交互数据,确定问题文本;将所述问题文本输入文本交互机器人,使得所述文本交互机器人输出与所述问题文本对应的应答文本;应用语音合成技术合成与所述应答文本对应的应答音频数据。5.根据权利要求4所述的方法,其特征在于,所述基于所述交互数据,确定问题文本,包括:确定所述交互数据的数据格式;基于所述数据格式,对所述交互数据进行处理,得到问题文本。6.根据权利要求1所述的方法,其特征在于,所述基于读取到的嘴型数据在所述客户端的H5展示页面渲染数字人,包括:调用预设的渲染模块从预设的资源模块中获取H5资源数据;应用所述渲染模块基于所述H5资源数据和读取到的嘴型数据在所述客户端的H5展示页面动态的渲染数字人。7.一种数字人渲染装置,其特征在于,应用于客户端,包括:获取单元,用于获取客户输入的交互数据;2CN113886551A权利要求书2/2页触发单元,用于将所述交互数据发送至预设的中控系统,以触发所述中控系统对所述交互数据进行处理,得到渲染协议数据;解析单元,用于获得所述中控系统反馈的所述渲染协议数据,对渲染协议数据进行解析,获得应答音频数据和嘴型数据;保存单元,用于将所述应答音频数据保存至第一渲染队列中,以及将所述嘴型数据保存至第二渲染队列中;渲染单元,用于同步读取所述第一渲染队列和所述第二渲染队列中的数据,并基于读取到的嘴型数据在所述客户端的H5展示页面渲染数字人,以及基于读取到的应答音频数据播放音频。8.根据权利要求6所述的装置,其特征在于,所述触发单元,包括:发送子单元,