预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN108091340A(43)申请公布日2018.05.29(21)申请号201611035943.3(22)申请日2016.11.22(71)申请人北京京东尚科信息技术有限公司地址100195北京市海淀区杏石口路65号西杉创意园西区11C楼东段1-4层西段1-4层申请人北京京东世纪贸易有限公司(72)发明人雷利博薛韬罗超(74)专利代理机构中科专利商标代理有限责任公司11021代理人倪斌(51)Int.Cl.G10L17/02(2013.01)G10L17/04(2013.01)权利要求书2页说明书6页附图4页(54)发明名称声纹识别方法和声纹识别系统(57)摘要本发明提供了一种声纹识别方法和系统,所述方法包括:接收待测试音频并将其分割为第一和第二部分;选择一个样本音频并将其分割为第一和第二部分;通过使用梅尔倒谱系数的提取方法,提取针对待测试音频和样本音频的特征矩阵;通过将待测试音频的第一部分的特征矩阵作为第一类样本,并将所选样本音频的特征矩阵作为第二类样本,执行支持向量机训练,并计算待测试音频的第二部分与第二类样本的匹配程度;以类似方式针对样本音频的第一部分、待测试音频的第一部分和样本音频的第二部分,分别计算其与对应作为第二类样本的待测试音频、所选样本音频和待测试音频的匹配程度;根据上述各匹配程度,确定待测试音频和样本音频是否来自同一个人的声音。CN108091340ACN108091340A权利要求书1/2页1.一种声纹识别方法,包括:接收待测试音频并将待测试音频分割为第一部分和第二部分;从样本数据库中选择一个样本音频并将所选样本音频分割为第一部分和第二部分;通过使用梅尔倒谱系数的提取方法,提取针对所述待测试音频以及所选样本音频的特征矩阵;通过将待测试音频的第一部分的特征矩阵作为第一类样本,并将所选样本音频的特征矩阵作为第二类样本,执行支持向量机训练,并计算待测试音频的第二部分属于第二类样本的比例a;通过将所选样本音频的第一部分的特征矩阵作为第一类样本,并将待测试音频的特征矩阵作为第二类样本,执行支持向量机训练,并计算所选样本音频的第二部分属于第二类样本的比例b;通过将待测试音频的第二部分的特征矩阵作为第一类样本,并将所选样本音频的特征矩阵作为第二类样本,执行支持向量机训练,并计算待测试音频的第一部分属于第二类样本的比例c;通过将所选样本音频的第二部分的特征矩阵作为第一类样本,并将待测试音频的特征矩阵作为第二类样本,执行支持向量机训练,并计算所选样本音频的第一部分属于第二类样本的比例d;根据计算出的a、b、c和d,计算待测试音频与所选样本音频的匹配程度,以便确定待测试音频和所选样本音频是否来自同一个人的声音。2.根据权利要求1所述的方法,还包括:对所接收的待测试音频进行预处理,其中所述预处理包括以下操作中的至少一个:对待检测音频进行预加重;通过使用交叠分段的分帧方法对待测试音频进行分帧;施加汉明窗以消除吉布斯效应;以及区分语音帧和非语音帧并舍弃非语音帧。3.根据权利要求1所述的方法,其中所述将待测试音频分割为第一部分和第二部分包括将待测试音频分割为长度相等的两部分。4.根据权利要求1所述的方法,其中所述将所选样本音频分割为第一部分和第二部分包括将所选样本音频分割为长度相等的两部分。5.根据权利要求1所述的方法,其中所述计算待测试音频与样本音频的匹配程度包括:计算a、b、c和d的平均值;以及将所述平均值与0.5的比值确定作为待测试音频与样本音频的匹配程度。6.一种声纹识别系统,包括:接收器,配置为接收待测试音频;样本数据库,配置为存储一个或更多个样本音频;支持向量机,配置为根据分类样本对测试数据进行分类;控制器,配置为:将来自接收器的待测试音频分割为第一部分和第二部分,并从样本数据库中选择一个样本音频并将所选样本音频分割为第一部分和第二部分;2CN108091340A权利要求书2/2页通过使用梅尔倒谱系数的提取方法,提取针对待测试音频以及所选样本音频的特征矩阵;通过向支持向量机输入作为第一类样本的待测试音频的第一部分的特征矩阵以及作为第二类样本的所选样本音频的特征矩阵并训练所述支持向量机,计算待测试音频的第二部分属于第二类样本的比例a;通过向支持向量机输入作为第一类样本的所选样本音频的第一部分的特征矩阵以及作为第二类样本的待测试音频的特征矩阵并训练所述支持向量机,计算所选样本音频的第二部分属于第二类样本的比例b;通过向支持向量机输入作为第一类样本的待测试音频的第二部分的特征矩阵以及作为第二类样本的所选样本音频的特征矩阵并训练所述支持向量机,计算待测试音频的第一部分属于第二类样本的比例c;通过向支持向量机输入作为第一类样本的所选样本音频的第二部分的特