预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110853652A(43)申请公布日2020.02.28(21)申请号201910961230.7(22)申请日2019.10.10(71)申请人平安科技(深圳)有限公司地址518000广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼(72)发明人冯惠华(74)专利代理机构深圳市沃德知识产权代理事务所(普通合伙)44347代理人高杰于志光(51)Int.Cl.G10L17/00(2013.01)G10L17/02(2013.01)G10L17/04(2013.01)G10L25/24(2013.01)权利要求书2页说明书10页附图2页(54)发明名称身份识别方法、装置及计算机可读存储介质(57)摘要本发明涉及人工智能技术,揭露了一种身份识别方法,包括:收集声纹样本集,建立声纹库;对所述声纹样本集进行预处理操作,得到文本相关声纹向量序列集和文本无关声纹向量序列集;将所述文本相关声纹向量序列集进行压缩处理,得到声纹码本集,基于在文本相关声纹识别场景中接收用户的声纹语音内容接收用户的声纹语音内容,根据所述声纹语音内容与声纹码本集的欧式距离识别出所述用户的身份;对所述文本无关声纹向量序列集提取梅尔频率倒谱系数,基于在文本无关声纹识别场景中接收用户的声纹语音内容,根据所述梅尔频率倒谱系数检测出所述用户的身份。本发明还提出一种身份识别装置以及一种计算机可读存储介质。本发明实现了身份的精准识别。CN110853652ACN110853652A权利要求书1/2页1.一种身份识别方法,其特征在于,所述方法包括:收集声纹样本集,建立声纹库,其中,所述声纹库包括文本相关声纹集和文本无关声纹集;对所述声纹库中的声纹进行预处理操作,得到声纹向量序列集,其中,所述声纹向量序列集包括文本相关声纹向量序列集和文本无关声纹向量序列集;将所述文本相关声纹向量序列集进行压缩处理,得到声纹码本集;基于在文本相关声纹识别场景中接收用户的声纹语音内容,计算所述声纹语音内容与所述声纹码本集的欧式距离,根据所述欧式距离识别出所述用户的身份信息;对所述文本无关声纹向量序列集提取梅尔频率倒谱系数集;基于在文本无关声纹识别场景中接收用户的声纹语音内容,根据所述用户的声纹语音内容提取所述用户的梅尔频率倒谱系数,并根据上述的梅尔频率倒谱系数集识别出所述用户的身份信息。2.如权利要求1所述的身份识别方法,其特征在于,所述对所述声纹库中的声纹进行预处理操作,得到声纹向量序列集,包括:通过数字滤波器对所述声纹库中的声纹进行预加重,得到高频声纹集;通过预设的声纹帧长对所述高频声纹集进行分帧处理,得到分帧高频声纹集;利用汉明窗对所述分帧高频声纹集进行加窗,得到分帧高频的声纹分量序列集,利用双门限端点对所述声纹分量序列集进行去噪,得到所述声纹向量序列集。3.如权利要求1所述的身份识别方法,其特征在于,所述计算所述声纹语音内容与所述声纹码本集的欧式距离的方法包括:其中,X表示用户的声纹语音内容,Y表示声纹码本集中的声纹码本,xi表示用户的第i声纹语音内容,yi表示声纹码本集中的第i个声纹码本。4.如权利要求1至3中任意一项所述的身份识别方法,其特征在于,所述对所述文本无关声纹向量序列集提取梅尔频率倒谱系数包括:对所述文本无关声纹向量序列集进行傅里叶变换,得到所述文本无关声纹向量序列集的频谱,并计算所述频谱的功率谱;利用三角滤波器对所述功率谱进行过滤,对过滤后的所述功率谱进行功率转换后得到所述梅尔频率倒谱系数。5.如权利要求4所述的身份识别方法,其特征在于,所述对过滤后的所述功率谱进行功率转换后得到所述梅尔频率倒谱系数的方法包括:其中,Ci(k)表示梅尔频率倒谱系数,L表示MFCC的阶数,Pi(k)表示功率谱、m表示梅尔频率倒谱的序列数,M表示三角滤波器个数。6.一种身份识别装置,其特征在于,所述装置包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的身份识别程序,所述身份识别程序被所述处理器执行时实现如2CN110853652A权利要求书2/2页下步骤:收集声纹样本集,建立声纹库,其中,所述声纹库包括文本相关声纹集和文本无关声纹集;对所述声纹库中的声纹进行预处理操作,得到声纹向量序列集,其中,所述声纹向量序列集包括文本相关声纹向量序列集和文本无关声纹向量序列集;将所述文本相关声纹向量序列集进行压缩处理,得到声纹码本集;基于在文本相关声纹识别场景中接收用户的声纹语音内容,计算所述声纹语音内容与所述声纹码本集的欧式距离,根据所述欧式距离识别出所述用户的身份信息;对所述文本无关声纹向量序列集提取梅尔频率倒谱系数集;基于在文本无关声纹识别场景中接收用户的声纹语音内容,根据所述用户的声纹语音内容提取所