预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共14页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN108986789A(43)申请公布日2018.12.11(21)申请号201811060707.6(22)申请日2018.09.12(71)申请人携程旅游信息技术(上海)有限公司地址201203上海市浦东新区自由贸易试验区碧波路518号302室(72)发明人陈浩(74)专利代理机构上海隆天律师事务所31282代理人臧云霄钟宗(51)Int.Cl.G10L15/02(2006.01)G10L15/06(2013.01)G10L15/26(2006.01)G10L25/24(2013.01)G06K9/62(2006.01)权利要求书2页说明书8页附图3页(54)发明名称语音识别方法、装置、存储介质及电子设备(57)摘要本发明提供了一种语音识别方法、装置、存储介质及电子设备,所述语音识别方法包括如下步骤:获取多个样本语音数据;采用梅尔频率倒普系数对每个样本语音数据进行语音特征提取,以得到每个样本语音数据的特征矩阵;按照一预设值构建每个样本语音数据的特征矩阵的大小,以得到归一化的特征矩阵的集合;基于所述归一化的特征矩阵的集合以支持向量机算法建立一分类模型;通过所述分类模型识别目标语音数据。本发明可以准确区分多种语言的目标语音数据,特别是带有彩铃或振铃的外呼呼叫失败的语音数据。CN108986789ACN108986789A权利要求书1/2页1.一种语音识别方法,其特征在于,包括如下步骤:获取多个样本语音数据;采用梅尔频率倒普系数对每个样本语音数据进行语音特征提取,以得到每个样本语音数据的特征矩阵;按照一预设值构建每个样本语音数据的特征矩阵的大小,以得到归一化的特征矩阵的集合;基于所述归一化的特征矩阵的集合以支持向量机算法建立一分类模型;通过所述分类模型识别目标语音数据。2.根据权利要求1所述的语音识别方法,其特征在于,所述样本语音数据被划分为第一语音数据和第二语音数据,所述样本语音数据的种类作为所述分类模型的分类输出。3.根据权利要求2所述的语音识别方法,其特征在于,通过对所述第一语音数据和第二语音数据中数量较多的一种语音数据进行采样,以使得所述第一语音数据和第二语音数据的数量相同。4.根据权利要求2所述的语音识别方法,其特征在于,所述第一语音数据和所述第二语音数据被分别标记为拒接语音数据及无人接听语音数据。5.根据权利要求2所述的语音识别方法,其特征在于,所述第一语音数据和第二语音数据包括彩铃或振铃。6.根据权利要求1所述的语音识别方法,其特征在于,所述特征矩阵的集合中的各特征矩阵被构建以指示每一样本语音数据的后n秒语音数据,n为大于等于5小于等于15的整数。7.根据权利要求6所述的语音识别方法,其特征在于,基于n的取值使所说预设值为[1,M],M为大于等于1的整数,所述按照一预设值构建每个样本语音数据的特征矩阵的大小的步骤包括:将每个样本语音数据的特征矩阵的大小构建为[1,M],其中M为该特征矩阵的列数。8.据权利要求7所述的语音识别方法,其特征在于,所述将每个样本语音数据的特征矩阵的大小构建为[1,M]的步骤包括:若所述样本语音数据的特征矩阵的大小超过[1,M],则截取该样本语音数据的特征矩阵中的后M列,使其大小为[1,M];若所述样本语音数据的特征矩阵的大小小于[1,M],则用使该样本语音数据的特征矩阵前项填充为0,使其大小为[1,M]。9.根据权利要求7或8所述的语音识别方法,其特征在于,n为10秒,M为17381。10.根据权利要求1所述的语音识别方法,其特征在于,所述基于所述归一化的特征矩阵的集合以支持向量机算法建立一分类模型的步骤包括:将所述归一化的特征矩阵的集合按照一预设比例建立训练数据集、验证数据集和测试数据集;基于所述训练数据集、验证数据集和测试数据集以支持向量机算法建立所述分类模型;其中,所述训练数据集用于训练模型或确定模型参数,所述验证数据集用于做模型选择,所述测试数据集用于测试已训练好的模型的分辨能力。11.根据权利要求10所述的语音识别方法,其特征在于,所述训练数据集、验证数据集2CN108986789A权利要求书2/2页和测试数据的预设比例为6:2:2。12.一种语音识别装置,其特征在于,包括:获取模块,用于获取多个样本语音数据;特征提取模块,用于采用梅尔频率倒普系数对每个样本语音数据进行语音特征提取,以得到每个样本语音数据的特征矩阵;特征构建模块,用于按照一预设值构建每个样本语音数据的特征矩阵的大小,以得到归一化的特征矩阵的集合;模型构建模块,用于基于所述归一化的特征矩阵的集合以支持向量机算法建立一分类模型;识别模块,用于通过所述分类模型识别目标语音数据。13.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所