语音识别方法、装置、设备和存储介质.pdf
努力****甲寅
亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
语音识别方法、装置、设备和存储介质.pdf
本申请属于数据处理领域,具体涉及一种语音识别方法、装置、设备和存储介质。本申请旨在解决目前的智能设备识别用户指令的准确率较低的问题。本申请的语音识别方法,该方法包括:获取终端设备上设置的N个语音采集装置采到的N个待处理语音信号;将N个待处理语音信号中第n个待处理语音信号划分为M
视频语音识别方法、装置、设备和存储介质.pdf
本申请提出一种视频语音识别方法、装置、设备和存储介质,涉及语音识别技术领域其中,方法,包括:对视频进行处理,获取多个音频子片段,以及与每个音频子片段对应的图像帧序列;对图像帧序列进行文本识别,获取多个文本结果,并对多个文本结果进行处理,获取多个关键词;通过语音识别模型对每个音频子片段进行处理,获取多个候选语音识别结果;根据多个候选语音识别结果和多个关键词确定每个音频子片段的目标文本识别结果,根据每个音频子片段的目标文本识别结果,获取视频的语音识别结果。由此,通过视频的图像中的文本识别结果辅助视频语音识别,
语音识别方法、装置和存储介质.pdf
本发明实施例公开了一种语音识别方法、装置和存储介质;本实施例在获取到音频数据后,可以通过DSP对该音频数据进行模糊语音识别,当确定存在唤醒词时,才由该DSP唤醒处于休眠状态的CPU,并通过CPU对该音频数据进行语义分析,然后,根据分析结果执行相应操作;该方案可以在保留移动性和语音唤醒功能的前提下,大大减少系统功耗,从而延长移动终端的待机时间,改善移动终端的性能。
语音识别方法、装置和存储介质.pdf
本公开提出一种语音识别方法、装置和存储介质,涉及语音识别技术领域。本公开的一种语音识别方法,包括:根据当前语句的语音信号获取候选lattice;根据当前语句对应的上文文本重置神经网络模型,其中,上文文本为当前语句的前一句或多句的识别文本;通过重置后的神经网络模型对候选lattice重打分,获取重打分lattice;根据重打分lattice确定当前语句的识别文本。通过这样的方法,对当前语句的语音识别能够考虑到上文一句或多句的信息,从而更加充分的利用先验信息,使重打分更加准确,提高语音识别的准确率。
语音识别方法、装置、设备及存储介质.pdf
本发明公开了一种语音识别方法、装置、设备及存储介质。该方法包括:将目标用户语音数据输入设定声学模型中,输出所述目标用户语音数据对应的声学特征序列;其中,所述目标用户语音数据携带有地域属性;所述声学特征序列包括多个声学特征;确定所述声学特征序列中各声学特征对应的至少一个目标词,获得多个目标词;将所述多个目标词输入领域语言模型中,输出目标语音识别结果;其中,所述目标语音识别结果由词序列表征。通过本发明的技术方案,可以提高语音识别的准确性。