预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113744718A(43)申请公布日2021.12.03(21)申请号202010464302.X(22)申请日2020.05.27(71)申请人海尔优家智能科技(北京)有限公司地址100086北京市海淀区知春路106号太平洋国际大厦6层601-602室(72)发明人苏腾荣马志芳李想赵培(74)专利代理机构北京康信知识产权代理有限责任公司11240代理人张丹红(51)Int.Cl.G10L15/02(2006.01)G10L25/51(2013.01)权利要求书2页说明书10页附图3页(54)发明名称语音文本的输出方法及装置、存储介质、电子装置(57)摘要本发明提供了一种语音文本的输出方法及装置、存储介质、电子装置,上述方法包括:对目标语音进行语音识别,得到基于音素的语音识别结果;根据预置的音素混淆矩阵对所述语音识别结果进行修正,并输出修正后的语音文本;其中,所述音素混淆矩阵用于指示正确结果的音素序列和发音混淆的N个音素序列之间每个音素的混淆概率,其中,N为正整数,即通过上述技术方案,通过生成的音素混淆矩阵对语音识别结果进行修正,进而能够得到修正后的语音文本,因此,可以解决现有技术中传统语音对话系统中语音输出结果与真实输入存在的偏差无法进行修正等问题,以减少语音错误产生的严重影响,适应各种个性化口音。CN113744718ACN113744718A权利要求书1/2页1.一种语音文本的输出方法,其特征在于,包括:对目标语音进行语音识别,得到基于音素的语音识别结果;根据预置的音素混淆矩阵对所述语音识别结果进行修正,并输出修正后的语音文本;其中,所述音素混淆矩阵用于指示正确结果的音素序列和发音混淆的N个音素序列之间每个音素的混淆概率,其中,N为正整数。2.根据权利要求1所述的方法,其特征在于,根据预置的音素混淆矩阵对所述语音识别结果进行修正,并输出修正后的语音文本之前,所述方法还包括:获取已标注正确结果的音素序列,以及发音混淆的N个音素序列;将所述已标注正确结果的音素序列和所述N个音素序列对齐,以确定用于指示所述每个音素的混淆概率的音素混淆矩阵。3.根据权利要求1所述的方法,其特征在于,根据预置的音素混淆矩阵对所述语音识别结果进行修正,包括:将所述语音识别结果和所述音素混淆矩阵进行运算,得到运算结果;根据运算结果对所述语音识别结果进行修正。4.根据权利要求3所述的方法,其特征在于,将所述语音识别结果和所述音素混淆矩阵进行运算,得到运算结果,包括:按照预设算法对所述语音识别结果和音素混淆矩阵运算,得到多个混淆概率值,其中,所述多个混淆概率值用于指示所述运算结果。5.根据权利要求4所述的方法,其特征在于,根据运算结果对所述语音识别结果进行修正,包括:从所述多个混淆概率值中选择混淆概率值最大所对应的正确结果的音速序列;根据所述混淆概率最大所对应的正确结果的音速序列对所述语音识别结果进行修正。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取目标对象的语料数据;根据获取到的所述语料数据确定所述语料数据对应的正确结果的音素序列,以及发音混淆的M个音素序列,其中,M为正整数;根据所述语料数据对应的正确结果的音素序列,以及发音混淆的M个音素序列确定所述目标对象的音素混淆矩阵。7.根据权利要求6所述的方法,其特征在于,根据所述语料数据对应的正确结果的音素序列,以及发音混淆的M个音素序列确定所述目标对象的音素混淆矩阵之后,所述方法还包括:在接收到所述目标对象的语音数据的情况下,对所述目标对象的语音数据进行识别,以得到基于音素的目标识别结果;根据所述目标对象的音素混淆矩阵对所述目标识别结果进行修正。8.一种语音文本的输出装置,其特征在于,包括:确定模块,用于对目标语音进行语音识别,得到基于音素的语音识别结果;处理模块,用于根据预置的音素混淆矩阵对所述语音识别结果进行修正,并输出修正后的语音文本;其中,所述音素混淆矩阵用于指示正确结果的音素序列和发音混淆的N个音素序列之2CN113744718A权利要求书2/2页间每个音素的混淆概率,其中,N为正整数。9.一种计算机可读的存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至7任一项中所述的方法。10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至7任一项中所述的方法。3CN113744718A说明书1/10页语音文本的输出方法及装置、存储介质、电子装置技术领域[0001]本发明涉及通信领域,具体而言,涉及一种语音文本的输出方法及装置、存储介质、电子装置。背景技术[0002]