语音控制方法、装置、电子设备以及存储介质.pdf
是你****松呀
亲,该文档总共35页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
语音控制方法、装置、电子设备以及存储介质.pdf
本申请公开了一种语音控制方法、装置、电子设备以及存储介质,显示图形界面,响应语音交互指令,获取图形界面对应的图形界面截图,对图形界面截图进行处理,获得图形界面中包括的多个目标元素,当通过多个目标元素组成多个满足预设排列规则的元素集合时,按对应的集合尺寸从大到小的顺序从多个元素集合中筛选出目标元素集合,对至少两个目标元素进行索引编号,获得至少两个目标元素各自对应的目标索引编号,基于至少两个目标元素各自对应的目标索引编号,从至少两个元素中确定语音交互指令对应的目标元素,从而可以无需被控制应用对语音控制进行适配
语音处理方法、装置、电子设备以及存储介质.pdf
本申请公开了一种语音处理方法、装置、电子设备以及存储介质,包括:获取已标注的第一语音样本、未标注的第二语音样本、预训练的基础语音模型、流式语音处理模型和语言模型;根据第一语音样本对流式语音处理模型进行调整,得到调整后流式语音处理模型;基于第一语音样本、第二语音样本以及流式语音处理模型对应的教师模型,对流式语音处理模型进行训练,得到训练后流式语音处理模型;根据第一语音样本、基础语音模型以及语言模型对第二语音样本进行标注,得到标注后第二语音样本;基于第一语音样本和标注后第二语音样本对训练后流式语音处理模型进行
语音处理方法、装置、电子设备以及存储介质.pdf
本公开提供了语音处理方法、装置、电子设备、存储介质以及程序产品,涉及人工智能技术领域,尤其涉及车联网和智能座舱等技术领域。具体实现方案为:响应于语音交互功能被唤醒,获取被用于唤醒语音交互功能的唤醒语音的唤醒声纹特征;从接收到的交互语音中提取至少一个交互声纹特征,交互语音中包括至少一个单声源交互语音,至少一个单声源交互语音与至少一个交互声纹特征一一对应;从至少一个交互声纹特征中确定与唤醒声纹特征相匹配的目标交互声纹特征;从与目标交互声纹特征相对应的目标单声源交互语音中提取目标语音特征;以及发送目标语音特征,
语音唤醒方法、装置、电子设备以及存储介质.pdf
本公开提供了语音唤醒方法、装置、电子设备、存储介质以及程序产品,涉及人工智能技术领域,尤其涉及语音交互、云计算、智能座舱和车联网等技术领域。具体实现方案为:响应于确定唤醒语音来自目标用户,获取与目标用户相对应的目标唤醒阈值;对唤醒语音进行唤醒识别,得到唤醒识别结果;以及基于唤醒识别结果和目标唤醒阈值,确定唤醒结果,唤醒结果指示了语音交互功能是否被唤醒语音唤醒。
语音识别方法、装置、电子设备以及存储介质.pdf
本申请实施例提供一种语音识别方法、装置、电子设备以及存储介质。本申请实施例提供的语音识别方法,包括:获取第一语音片段的频谱信息,第一语音片段包含有目标语音块和辅助语音块,辅助语音块为目标语音块相邻的语音块;根据第一语音片段的频谱信息,以及辅助语音块的有效区间和权重,对目标语音块进行识别。本申请实施例提供的语音识别方法,可以提高流式语音识别的时识别精度。