语音处理方法、装置、设备以及存储介质.pdf
书生****12
亲,该文档总共33页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
语音处理方法、装置、设备以及存储介质.pdf
本申请公开了一种语音处理方法、装置、设备以及存储介质,属于计算机技术领域。通过本申请实施例提供的技术方案,在进行语音降噪时,无需通过结构复杂的模型进行噪声识别,直接基于语音数据的频域信息确定一个第一掩码,将第一掩码与语音数据的频谱结合,就能够得到目标语音数据,在保证降噪效果的同时,提高了语音降噪的速度,减少了计算资源的消耗。
语音处理方法、装置、电子设备以及存储介质.pdf
本公开提供了语音处理方法、装置、电子设备、存储介质以及程序产品,涉及人工智能技术领域,尤其涉及车联网和智能座舱等技术领域。具体实现方案为:响应于语音交互功能被唤醒,获取被用于唤醒语音交互功能的唤醒语音的唤醒声纹特征;从接收到的交互语音中提取至少一个交互声纹特征,交互语音中包括至少一个单声源交互语音,至少一个单声源交互语音与至少一个交互声纹特征一一对应;从至少一个交互声纹特征中确定与唤醒声纹特征相匹配的目标交互声纹特征;从与目标交互声纹特征相对应的目标单声源交互语音中提取目标语音特征;以及发送目标语音特征,
语音处理方法、装置、电子设备以及存储介质.pdf
本申请公开了一种语音处理方法、装置、电子设备以及存储介质,包括:获取已标注的第一语音样本、未标注的第二语音样本、预训练的基础语音模型、流式语音处理模型和语言模型;根据第一语音样本对流式语音处理模型进行调整,得到调整后流式语音处理模型;基于第一语音样本、第二语音样本以及流式语音处理模型对应的教师模型,对流式语音处理模型进行训练,得到训练后流式语音处理模型;根据第一语音样本、基础语音模型以及语言模型对第二语音样本进行标注,得到标注后第二语音样本;基于第一语音样本和标注后第二语音样本对训练后流式语音处理模型进行
语音处理方法、装置、终端设备以及存储介质.pdf
本发明公开了一种语音处理方法、装置、终端设备以及存储介质,通过获取当前用户的声纹信息;根据所述声纹信息选取或确定对应的声纹引擎;基于所述声纹引擎与所述当前用户进行语音交互。通过根据当前用户的声纹信息制作声纹引擎,并基于对应的声纹引擎与用户进行语音交互,提升用户使用终端的趣味性,从而改善用户体验,提升用户的使用黏度。
语音播放方法、装置、设备以及存储介质.pdf
本申请实施例公开了一种语音播放方法、装置、设备以及存储介质,可适用于应用于云技术、人工智能、智慧交通、物联网、辅助驾驶等各种场景。该方法包括:响应于用户登录目标终端的终端系统,显示音色定制提示页面;获取用户基于音色定制提示页面上传的第一音频数据,显示音色列表页面,音色列表页面包括由第一音频数据确定的第一音色配置信息,第一音频数据和第一音色配置信息对应于同一音色;响应于用户针对音色列表页面中目标音色配置信息的设置指令,通过目标终端以目标音色配置信息对应的音色播放音频信息。采用本申请实施例,可快速便捷地为终端