语音处理方法、装置、终端设备以及存储介质.pdf
冬易****娘子
亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
语音处理方法、装置、终端设备以及存储介质.pdf
本发明公开了一种语音处理方法、装置、终端设备以及存储介质,通过获取当前用户的声纹信息;根据所述声纹信息选取或确定对应的声纹引擎;基于所述声纹引擎与所述当前用户进行语音交互。通过根据当前用户的声纹信息制作声纹引擎,并基于对应的声纹引擎与用户进行语音交互,提升用户使用终端的趣味性,从而改善用户体验,提升用户的使用黏度。
语音辅助方法、装置、终端设备以及存储介质.pdf
本发明公开了一种语音辅助方法、装置、终端设备以及存储介质,通过响应于使用者的指令信息,启动指令信息对应的服务模式;若服务模式为盲道探测,则生成第一语音信息,用于引导使用者执行预设动作;在使用者执行预设动作时,通过摄像头采集图像数据,并基于探测模型对图像数据进行处理,得到行进方案,生成第二语音信息,用于引导使用者执行行进动作;在使用者执行行进动作时,获取使用者的运动状态信息及当前道路信息,基于运动状态信息及当前道路信息生成第三语音信息,用于为使用者提供道路指引。通过响应使用者的指令信息,引导使用者执行行进动
语音处理方法、装置、设备以及存储介质.pdf
本申请公开了一种语音处理方法、装置、设备以及存储介质,属于计算机技术领域。通过本申请实施例提供的技术方案,在进行语音降噪时,无需通过结构复杂的模型进行噪声识别,直接基于语音数据的频域信息确定一个第一掩码,将第一掩码与语音数据的频谱结合,就能够得到目标语音数据,在保证降噪效果的同时,提高了语音降噪的速度,减少了计算资源的消耗。
语音处理方法、装置、电子设备以及存储介质.pdf
本申请公开了一种语音处理方法、装置、电子设备以及存储介质,包括:获取已标注的第一语音样本、未标注的第二语音样本、预训练的基础语音模型、流式语音处理模型和语言模型;根据第一语音样本对流式语音处理模型进行调整,得到调整后流式语音处理模型;基于第一语音样本、第二语音样本以及流式语音处理模型对应的教师模型,对流式语音处理模型进行训练,得到训练后流式语音处理模型;根据第一语音样本、基础语音模型以及语言模型对第二语音样本进行标注,得到标注后第二语音样本;基于第一语音样本和标注后第二语音样本对训练后流式语音处理模型进行
语音处理方法、装置、电子设备以及存储介质.pdf
本公开提供了语音处理方法、装置、电子设备、存储介质以及程序产品,涉及人工智能技术领域,尤其涉及车联网和智能座舱等技术领域。具体实现方案为:响应于语音交互功能被唤醒,获取被用于唤醒语音交互功能的唤醒语音的唤醒声纹特征;从接收到的交互语音中提取至少一个交互声纹特征,交互语音中包括至少一个单声源交互语音,至少一个单声源交互语音与至少一个交互声纹特征一一对应;从至少一个交互声纹特征中确定与唤醒声纹特征相匹配的目标交互声纹特征;从与目标交互声纹特征相对应的目标单声源交互语音中提取目标语音特征;以及发送目标语音特征,