语音处理方法、装置、设备以及存储介质.pdf
书生****12
亲,该文档总共33页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
语音处理方法、装置、设备以及存储介质.pdf
本申请公开了一种语音处理方法、装置、设备以及存储介质,属于计算机技术领域。通过本申请实施例提供的技术方案,在进行语音降噪时,无需通过结构复杂的模型进行噪声识别,直接基于语音数据的频域信息确定一个第一掩码,将第一掩码与语音数据的频谱结合,就能够得到目标语音数据,在保证降噪效果的同时,提高了语音降噪的速度,减少了计算资源的消耗。
语音处理方法、装置、电子设备以及存储介质.pdf
本申请公开了一种语音处理方法、装置、电子设备以及存储介质,包括:获取已标注的第一语音样本、未标注的第二语音样本、预训练的基础语音模型、流式语音处理模型和语言模型;根据第一语音样本对流式语音处理模型进行调整,得到调整后流式语音处理模型;基于第一语音样本、第二语音样本以及流式语音处理模型对应的教师模型,对流式语音处理模型进行训练,得到训练后流式语音处理模型;根据第一语音样本、基础语音模型以及语言模型对第二语音样本进行标注,得到标注后第二语音样本;基于第一语音样本和标注后第二语音样本对训练后流式语音处理模型进行
语音处理方法、装置、电子设备以及存储介质.pdf
本公开提供了语音处理方法、装置、电子设备、存储介质以及程序产品,涉及人工智能技术领域,尤其涉及车联网和智能座舱等技术领域。具体实现方案为:响应于语音交互功能被唤醒,获取被用于唤醒语音交互功能的唤醒语音的唤醒声纹特征;从接收到的交互语音中提取至少一个交互声纹特征,交互语音中包括至少一个单声源交互语音,至少一个单声源交互语音与至少一个交互声纹特征一一对应;从至少一个交互声纹特征中确定与唤醒声纹特征相匹配的目标交互声纹特征;从与目标交互声纹特征相对应的目标单声源交互语音中提取目标语音特征;以及发送目标语音特征,
语音处理方法、装置、终端设备以及存储介质.pdf
本发明公开了一种语音处理方法、装置、终端设备以及存储介质,通过获取当前用户的声纹信息;根据所述声纹信息选取或确定对应的声纹引擎;基于所述声纹引擎与所述当前用户进行语音交互。通过根据当前用户的声纹信息制作声纹引擎,并基于对应的声纹引擎与用户进行语音交互,提升用户使用终端的趣味性,从而改善用户体验,提升用户的使用黏度。
语音处理方法、装置、设备及存储介质.pdf
本发明公开了一种语音处理方法、装置、设备及存储介质,所述方法包括:对待处理的语音段进行分解处理,获取多帧分解语音段;基于调整算法对多帧所述分解语音段进行调整,获取多帧待叠加语音段;计算获得每帧所述待叠加语音段的幅度增益因子;基于所述幅度增益因子,对每帧所述待叠加语音段的幅度进行调整,确定目标幅度;基于所述目标幅度,获取目标语音段。本发明的技术方案,通过增加幅度增益因子严格控制待叠加语音段的幅度,解决了由于合成语音幅度过大导致的在实时通信的恢复过程中可能出现较大的失真的问题,实现了避免语音波形尾部幅度过大等