语音识别方法及装置.pdf
曾琪****是我
亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
语音识别方法及装置.pdf
本发明提出一种语音识别方法及装置,其中方法包括:通过获取待识别的语音以及参数信息;所述参数信息包括:当前模式、所述语音的识别序号、内外噪音信息以及方位信息;提取所述语音对应的特征向量;根据所述当前模式、所述识别序号,确定所述语音是否属于单次唤醒多次识别模式中的非首次语音;若所述语音属于单次唤醒多次识别模式中的非首次语音,则根据所述参数信息和所述特征向量,获取语音识别结果、声学判定结果和语义判定结果,根据所述声学判定结果和所述语义判定结果,确定所述语音是否属于音乐领域;若所述语音属于音乐领域,则根据所述语音
语音识别方法及装置.pdf
本发明实施例提供一种语音识别方法及装置,包括:获取语音信号对应的候选词串;调用领域语言模型,确定所述候选词串在领域语言模型中对应的概率增强系数;调用基本语言模型,确定所述候选词串在基本语言模型中的基本匹配概率;将所述概率增强系数结合所述基本匹配概率获得所述候选词串的总匹配概率;根据各候选词串的总匹配概率,计算各候选词串组成的词序列的概率,并根据概率最高的词序列生成所述语音信号对应的语言文本。本发明实施例提供的语音识别方法及装置,综合考虑了基本语言模型中的通用说话习惯,又兼顾了领域语言模型中的特定用词习惯,
语音识别方法及装置.pdf
本发明实施例提供一种语音识别方法及装置,服务器获得待处理的语音信号后,利用预先部署的增量训练模型对该语音信号进行识别从而得到文本信息。由于增量训练模型是预先采用知识蒸馏的方式,仅利用少量新业务场景的样本对旧业务场景的ASR模型进行训练得到的,使得该增量训练模型既能够适用于新业务场景又能保留旧业务场景的语音信号的识别能力,解决了采用全量数据训练带来的时间成本以及深度迁移学习导致的泛化能力下降的问题。
语音识别方法及装置.pdf
本申请实施例提供一种语音识别方法及装置,涉及信息处理技术领域,该方法包括:获取多通道语音文件;将多通道语音文件分离为每个对话人的独立语音子文件;获得每个独立语音子文件的起始时间信息、终止时间信息及对话人标识信息;将每个独立语音子文件识别为文本;生成多通道语音文件的特征信息,该特征信息包括多通道语音文件对应的每个独立语音子文件的文本信息、每个独立语音子文件的起始时间信息和终止时间信息、每个独立语音子文件的排序信息及每个独立语音子文件的对话人标识信息。因此可以从多通道语音文件中分离出每个对话人的文本信息、各文
语音识别方法及其装置.pdf
本说明书实施例公开了一种自动语音识别方法及其装置,其中,该方法包括:获取待识别语音,对待识别语音进行分割,以生成多个音频切片。将多个音频切片分别发送给多个语音识别方,其中,语音识别方能够生成音频切片对应的文本。分别从每个语音识别方接收音频切片对应的文本,对多个音频切片对应的文本进行文本聚合,以生成待识别语音的识别结果。由此,实现了将待识别语音的音频切片发送给多个语音识别方,由多个语音识别方共同完成待识别语音的识别工作,在语音识别过程中任何语音识别方无法获得全部的待识别语音,从而防止了待识别语音出现泄漏,对