预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114141232A(43)申请公布日2022.03.04(21)申请号202111470002.3(22)申请日2021.12.03(71)申请人阿里巴巴(中国)有限公司地址310051浙江省杭州市滨江区长河街道网商路699号4号楼5楼508室(72)发明人房福明袁志刚丁宁卢璐(74)专利代理机构北京合智同创知识产权代理有限公司11545代理人李杰张美洁(51)Int.Cl.G10L15/02(2006.01)G10L15/26(2006.01)权利要求书3页说明书11页附图6页(54)发明名称语音识别方法、交互方法、存储介质及程序产品(57)摘要本申请实施例提供了一种语音识别方法、交互方法、存储介质及程序产品,语音识别方法,包括:根据待识别语音的语音特征,获得所述待识别语音对应的多个候选字符序列及其对应的第一分数;获取所述待识别语音对应的发音对象的偏好词语;将多个所述候选字符序列与所述偏好词语进行匹配,根据匹配结果确定多个所述候选字符序列分别对应的第二分数;根据多个所述候选字符序列各自对应的第一分数以及第二分数,从多个所述候选字符序列中确定出作为语音识别结果的目标字符序列。CN114141232ACN114141232A权利要求书1/3页1.一种语音识别方法,包括:根据待识别语音的语音特征,获得所述待识别语音对应的多个候选字符序列及其对应的第一分数;获取所述待识别语音对应的发音对象的偏好词语;将多个所述候选字符序列与所述偏好词语进行匹配,根据匹配结果确定多个所述候选字符序列分别对应的第二分数;根据多个所述候选字符序列各自对应的第一分数以及第二分数,从多个所述候选字符序列中确定出作为语音识别结果的目标字符序列。2.根据权利要求1所述的方法,其中,所述根据待识别语音的语音特征,获得所述待识别语音对应的多个候选字符序列及其对应的第一分数,包括:根据所述待识别语音的语音特征,获得与所述待识别语音对应的多个建模单元,对所述待识别语音对应的多个所述建模单元进行集束搜索,获得多个路径及其对应的第一分数,所述路径用于表征待识别语音对应的候选字符序列;则所述将多个所述候选字符序列与所述偏好词语进行匹配,根据匹配结果确定多个所述候选字符序列分别对应的第二分数,包括:确定所述偏好词语对应的建模单元;针对任意路径,将所述路径包括的建模单元与所述偏好词语对应的建模单元进行匹配,根据匹配结果确定所述路径对应的第二分数。3.根据权利要求2所述的方法,其中,所述根据所述待识别语音的语音特征,获得与所述待识别语音对应的多个建模单元,包括:根据所述待识别语音的语音特征,获得与所述待识别语音对应的多个建模单元,以及确定多个建模单元分别对应的后验概率;所述针对任一路径,将当前路径上的建模单元与所述偏好词语对应的建模单元进行匹配,根据匹配结果确定当前路径对应的第二分数,包括:从所述待识别语音对应的多个建模单元中,确定出后验概率位于前列的建模单元;针对任一路径,确定当前路径上包括的所述后验概率位于前列的建模单元,将确定出的所述建模单元与所述偏好词语对应的建模单元进行匹配,根据匹配结果确定当前路径对应的第二分数。4.根据权利要求2所述的方法,其中,所述根据所述待识别语音的语音特征,获得与所述待识别语音对应的多个建模单元,对所述待识别语音对应的多个所述建模单元进行集束搜索,获得多个路径及其对应的第一分数,所述路径用于表征待识别语音对应的候选字符序列,包括:将所述待识别语音划分为多帧,针对当前帧待识别语音,根据当前帧待识别语音的语音特征获得与当前帧待识别语音对应的建模单元;将当前帧待识别语音对应的建模单元增加至上一帧待识别语音对应的路径的结尾,并进行集束搜索,获得当前帧待识别语音对应的多个路径及其对应的第一候选分数;所述针对任一路径,将当前路径上的建模单元与所述偏好词语对应的建模单元进行匹配,根据匹配结果确定当前路径对应的第二分数,包括:针对当前帧待识别语音对应的任一路径,将当前路径上的建模单元与所述偏好词语对2CN114141232A权利要求书2/3页应的建模单元进行匹配;若当前路径上的建模单元与所述偏好词语的部分匹配,则为所述当前路径增加待匹配标识,并记录与当前路径部分匹配的偏好词语,以在对下一帧待识别语音对应路径进行匹配时,优先将具有待匹配标识的路径匹配以及记录的偏好词语进行匹配,根据匹配结果确定具有待匹配标识的路径对应的第二分数。5.根据权利要求1所述的方法,其中,所述将多个所述候选字符序列与所述偏好词语进行匹配,根据匹配结果确定多个所述候选字符序列分别对应的第二分数,包括:确定所述偏好词语对应的多个偏好发音以及各个所述偏好发音的出现次数,并将出现次数位于前列的偏好发音确定为目标偏好发音